บทความนี้อธิบายว่า “หูของมนุษย์ไม่ได้ทำ Fourier Transform” แต่ใช้การกรองความถี่แบบซับซ้อนที่ใกล้เคียงกับ wavelet และ Gabor filter แทน
บทความ “The ear does not do a Fourier transform” โดย Galen อธิบายกลไกการแยกความถี่ของเสียงในหูมนุษย์ โดยชี้ให้เห็นว่าหูไม่ได้ใช้การแปลงฟูริเยร์ (Fourier Transform) แบบที่วิศวกรมักใช้วิเคราะห์สัญญาณเสียง แต่ใช้ระบบกรองความถี่ที่มีความแม่นยำเชิงเวลาและความถี่ที่ปรับเปลี่ยนได้ตามย่านความถี่ของเสียง
ประเด็นสำคัญจากบทความ
โครงสร้างของหูชั้นใน: เสียงทำให้เยื่อแก้วหูสั่นสะเทือน ส่งผ่านกระดูกในหูชั้นกลางไปยัง cochlea ซึ่งเป็นท่อเกลียวที่เต็มไปด้วยของเหลว การสั่นสะเทือนจะเคลื่อนผ่านเยื่อ basilar membrane ซึ่งมีคุณสมบัติทางกลที่เปลี่ยนแปลงตามตำแหน่ง ทำให้สามารถแยกความถี่ได้ตามตำแหน่ง (tonotopic organization)
การแปลงสัญญาณกลเป็นไฟฟ้า: เซลล์ขน (hair cells) บนเยื่อ basilar membrane จะสั่นตามความถี่ของเสียง ณ ตำแหน่งนั้น ๆ การสั่นนี้เปิด–ปิดช่องไอออนผ่านโครงสร้างคล้าย “trapdoor” ทำให้เกิดสัญญาณไฟฟ้าไปยังสมอง
การกรองความถี่แบบ dynamic: เส้นประสาทหูทำหน้าที่เป็น filter ที่แยกข้อมูลเชิงเวลาและความถี่ของเสียง โดยไม่ใช่การทำ Fourier Transform ซึ่งไม่มีความแม่นยำเชิงเวลา แต่หูมนุษย์มีการแลกเปลี่ยนระหว่างความแม่นยำเชิงเวลาและความถี่ตามย่านเสียง
ใกล้เคียงกับ wavelet และ Gabor filter: หูมนุษย์ใช้การกรองที่มีลักษณะคล้าย wavelet ที่มีความแม่นยำเชิงเวลาสูงในย่านความถี่สูง และความแม่นยำเชิงความถี่สูงในย่านความถี่ต่ำ ซึ่งต่างจาก Fourier ที่ไม่มีการแยกเวลา
ทฤษฎีการเข้ารหัสอย่างมีประสิทธิภาพ (efficient coding): งานวิจัยของ Lewicki (2002) แสดงให้เห็นว่าเสียงจากธรรมชาติ, สัตว์, และภาษามนุษย์มีรูปแบบการกระจายความถี่–เวลาแตกต่างกัน และระบบการได้ยินของมนุษย์อาจวิวัฒนาการมาเพื่อเข้ารหัสเสียงเหล่านี้อย่างมีประสิทธิภาพ
บทความนี้ชี้ให้เห็นว่า การรับรู้เสียงของมนุษย์ไม่ได้เป็นเพียงการแยกความถี่แบบคณิตศาสตร์ แต่เป็นกระบวนการทางชีวภาพที่ซับซ้อนและปรับตัวได้ ซึ่งสะท้อนถึงการปรับตัวของระบบประสาทให้เข้ากับสิ่งแวดล้อมและเสียงที่เราพบเจอในชีวิตประจำวัน
https://www.dissonances.blog/p/the-ear-does-not-do-a-fourier-transform
บทความ “The ear does not do a Fourier transform” โดย Galen อธิบายกลไกการแยกความถี่ของเสียงในหูมนุษย์ โดยชี้ให้เห็นว่าหูไม่ได้ใช้การแปลงฟูริเยร์ (Fourier Transform) แบบที่วิศวกรมักใช้วิเคราะห์สัญญาณเสียง แต่ใช้ระบบกรองความถี่ที่มีความแม่นยำเชิงเวลาและความถี่ที่ปรับเปลี่ยนได้ตามย่านความถี่ของเสียง
ประเด็นสำคัญจากบทความ
โครงสร้างของหูชั้นใน: เสียงทำให้เยื่อแก้วหูสั่นสะเทือน ส่งผ่านกระดูกในหูชั้นกลางไปยัง cochlea ซึ่งเป็นท่อเกลียวที่เต็มไปด้วยของเหลว การสั่นสะเทือนจะเคลื่อนผ่านเยื่อ basilar membrane ซึ่งมีคุณสมบัติทางกลที่เปลี่ยนแปลงตามตำแหน่ง ทำให้สามารถแยกความถี่ได้ตามตำแหน่ง (tonotopic organization)
การแปลงสัญญาณกลเป็นไฟฟ้า: เซลล์ขน (hair cells) บนเยื่อ basilar membrane จะสั่นตามความถี่ของเสียง ณ ตำแหน่งนั้น ๆ การสั่นนี้เปิด–ปิดช่องไอออนผ่านโครงสร้างคล้าย “trapdoor” ทำให้เกิดสัญญาณไฟฟ้าไปยังสมอง
การกรองความถี่แบบ dynamic: เส้นประสาทหูทำหน้าที่เป็น filter ที่แยกข้อมูลเชิงเวลาและความถี่ของเสียง โดยไม่ใช่การทำ Fourier Transform ซึ่งไม่มีความแม่นยำเชิงเวลา แต่หูมนุษย์มีการแลกเปลี่ยนระหว่างความแม่นยำเชิงเวลาและความถี่ตามย่านเสียง
ใกล้เคียงกับ wavelet และ Gabor filter: หูมนุษย์ใช้การกรองที่มีลักษณะคล้าย wavelet ที่มีความแม่นยำเชิงเวลาสูงในย่านความถี่สูง และความแม่นยำเชิงความถี่สูงในย่านความถี่ต่ำ ซึ่งต่างจาก Fourier ที่ไม่มีการแยกเวลา
ทฤษฎีการเข้ารหัสอย่างมีประสิทธิภาพ (efficient coding): งานวิจัยของ Lewicki (2002) แสดงให้เห็นว่าเสียงจากธรรมชาติ, สัตว์, และภาษามนุษย์มีรูปแบบการกระจายความถี่–เวลาแตกต่างกัน และระบบการได้ยินของมนุษย์อาจวิวัฒนาการมาเพื่อเข้ารหัสเสียงเหล่านี้อย่างมีประสิทธิภาพ
บทความนี้ชี้ให้เห็นว่า การรับรู้เสียงของมนุษย์ไม่ได้เป็นเพียงการแยกความถี่แบบคณิตศาสตร์ แต่เป็นกระบวนการทางชีวภาพที่ซับซ้อนและปรับตัวได้ ซึ่งสะท้อนถึงการปรับตัวของระบบประสาทให้เข้ากับสิ่งแวดล้อมและเสียงที่เราพบเจอในชีวิตประจำวัน
https://www.dissonances.blog/p/the-ear-does-not-do-a-fourier-transform
🧠👂 บทความนี้อธิบายว่า “หูของมนุษย์ไม่ได้ทำ Fourier Transform” แต่ใช้การกรองความถี่แบบซับซ้อนที่ใกล้เคียงกับ wavelet และ Gabor filter แทน
บทความ “The ear does not do a Fourier transform” โดย Galen อธิบายกลไกการแยกความถี่ของเสียงในหูมนุษย์ โดยชี้ให้เห็นว่าหูไม่ได้ใช้การแปลงฟูริเยร์ (Fourier Transform) แบบที่วิศวกรมักใช้วิเคราะห์สัญญาณเสียง แต่ใช้ระบบกรองความถี่ที่มีความแม่นยำเชิงเวลาและความถี่ที่ปรับเปลี่ยนได้ตามย่านความถี่ของเสียง
🔍 ประเด็นสำคัญจากบทความ
💠 โครงสร้างของหูชั้นใน: เสียงทำให้เยื่อแก้วหูสั่นสะเทือน ส่งผ่านกระดูกในหูชั้นกลางไปยัง cochlea ซึ่งเป็นท่อเกลียวที่เต็มไปด้วยของเหลว การสั่นสะเทือนจะเคลื่อนผ่านเยื่อ basilar membrane ซึ่งมีคุณสมบัติทางกลที่เปลี่ยนแปลงตามตำแหน่ง ทำให้สามารถแยกความถี่ได้ตามตำแหน่ง (tonotopic organization)
💠 การแปลงสัญญาณกลเป็นไฟฟ้า: เซลล์ขน (hair cells) บนเยื่อ basilar membrane จะสั่นตามความถี่ของเสียง ณ ตำแหน่งนั้น ๆ การสั่นนี้เปิด–ปิดช่องไอออนผ่านโครงสร้างคล้าย “trapdoor” ทำให้เกิดสัญญาณไฟฟ้าไปยังสมอง
💠 การกรองความถี่แบบ dynamic: เส้นประสาทหูทำหน้าที่เป็น filter ที่แยกข้อมูลเชิงเวลาและความถี่ของเสียง โดยไม่ใช่การทำ Fourier Transform ซึ่งไม่มีความแม่นยำเชิงเวลา แต่หูมนุษย์มีการแลกเปลี่ยนระหว่างความแม่นยำเชิงเวลาและความถี่ตามย่านเสียง
💠 ใกล้เคียงกับ wavelet และ Gabor filter: หูมนุษย์ใช้การกรองที่มีลักษณะคล้าย wavelet ที่มีความแม่นยำเชิงเวลาสูงในย่านความถี่สูง และความแม่นยำเชิงความถี่สูงในย่านความถี่ต่ำ ซึ่งต่างจาก Fourier ที่ไม่มีการแยกเวลา
💠 ทฤษฎีการเข้ารหัสอย่างมีประสิทธิภาพ (efficient coding): งานวิจัยของ Lewicki (2002) แสดงให้เห็นว่าเสียงจากธรรมชาติ, สัตว์, และภาษามนุษย์มีรูปแบบการกระจายความถี่–เวลาแตกต่างกัน และระบบการได้ยินของมนุษย์อาจวิวัฒนาการมาเพื่อเข้ารหัสเสียงเหล่านี้อย่างมีประสิทธิภาพ
บทความนี้ชี้ให้เห็นว่า การรับรู้เสียงของมนุษย์ไม่ได้เป็นเพียงการแยกความถี่แบบคณิตศาสตร์ แต่เป็นกระบวนการทางชีวภาพที่ซับซ้อนและปรับตัวได้ ซึ่งสะท้อนถึงการปรับตัวของระบบประสาทให้เข้ากับสิ่งแวดล้อมและเสียงที่เราพบเจอในชีวิตประจำวัน
https://www.dissonances.blog/p/the-ear-does-not-do-a-fourier-transform
0 ความคิดเห็น
0 การแบ่งปัน
20 มุมมอง
0 รีวิว