‘ลำโพงอัจฉริยะ บอกฉันเกี่ยวกับเซ็นเซอร์เสียงของคุณ’

'ลำโพงอัจฉริยะ บอกฉันเกี่ยวกับเซ็นเซอร์เสียงของคุณ'

เปิดไฟนางฟ้า” “หวัดดี Siri คุณต้องปรุงไก่งวงนานแค่ไหน”เทศกาลแห่งความสุขนี้ เราจะต้องสนทนากับลำโพงอัจฉริยะของเราอย่างไม่ต้องสงสัย ราวกับว่าพวกเขาเป็นสมาชิกอีกคนหนึ่งในครอบครัว และทุกครั้ง การตอบสนองที่ไร้ตัวตนจะเกิดขึ้นแทบจะทันทีทันใด อุปกรณ์เหล่านี้ ซึ่งรวมถึง ได้กลายเป็นสิ่งพิเศษในมากกว่าหนึ่งในห้าของครัวเรือนในสหราชอาณาจักรแล้ว แท้จริงแล้วในปี 2019 

มียอดขาย

เกือบ 147 ล้านหน่วยทั่วโลก และคาดว่ายอดขายในปี 2020 จะสูงขึ้น 10% กล่าวง่ายๆ ก็คือ ลำโพงอัจฉริยะมีความสามารถในระดับที่น่าอัศจรรย์ในการจดจำสิ่งที่เราพูด แม้ว่าการคาดเดาจะยังคงแน่ชัดว่าพวกเขาฟังมากแค่ไหนและข้อมูลที่รวบรวมไว้นั้นใช้ทำอะไร ไม่ต้องสงสัยเลยว่าเทคโนโลยี

การจดจำเสียงนั้นมีความแม่นยำที่น่าทึ่ง ซึ่งรวมถึงเซ็นเซอร์อะคูสติกที่มีความไวสูงเป็นพิเศษและอัลกอริธึมการเรียนรู้ของเครื่องที่ซับซ้อนซึ่งแปลเสียงพูด (ดูกล่อง “ จากคำพูดเป็นข้อความ” )แม้จะดีพอที่จะนำมาไว้ในบ้านของเรา แต่การพัฒนาเซ็นเซอร์สำหรับการจดจำเสียงยังไม่เสร็จสิ้น 

ยังไม่ชัดเจนว่าเทคโนโลยีใดให้คำมั่นสัญญามากที่สุด และแนวคิดใหม่ๆ มักได้รับความสนใจในเชิงพาณิชย์ ดูเหมือนว่าจะมีแนวโน้มว่าฟิลด์นี้จะถูกเปลี่ยนแปลงเนื่องจากการแพร่ระบาดของไวรัสโคโรนา เช่นเดียวกับที่อื่นๆ อีกมากมาย ด้วยเซ็นเซอร์ที่สวมใส่ได้ที่สามารถตรวจจับเสียงพูดผ่านการสั่นสะเทือน

ในการสร้างข้อความจากสุนทรพจน์สด จำเป็นต้องมีสองสิ่ง: เซ็นเซอร์อะคูสติกต้องแปลงคลื่นเสียงที่เข้ามาเป็นสัญญาณไฟฟ้า จากนั้นต้องใช้ซอฟต์แวร์เพื่อค้นหาว่าคำใดที่พูดไปแล้วสำหรับขั้นตอนที่สอง สัญญาณไฟฟ้าจะถูกแปลงแบบดั้งเดิมจากอะนาล็อกเป็นดิจิตอลก่อน จากนั้นจึงวิเคราะห์โดยใช้เทคนิค

การแปลงฟูริเยร์แบบเร็วเพื่อหาค่าความแปรผันของแอมพลิจูดของความถี่ต่างๆ เมื่อเวลาผ่านไป ส่วนเวลาเล็กๆ ของกราฟ ซึ่งแทนเสียงเล็กๆ ที่เรียกว่า “โทรศัพท์” จะถูกจับคู่กับเสียงสั้นในอุดมคติหรือ “หน่วยเสียง” ที่พวกมันอาจใช้แทน จากนั้นอัลกอริทึมจะสร้างหน่วยเสียงให้เป็นเสียงพูดแบบเต็ม

เนื่องจาก

เสียงแตกต่างกันมาก โปรแกรมเหล่านี้จึงไม่สามารถพึ่งพาพจนานุกรมการออกเสียงเพื่อรวมหน่วยเสียงเข้าด้วยกันได้ ซึ่งเป็นเหตุผลว่าทำไมการเรียนรู้ของเครื่องจึงมีประโยชน์อย่างมากในการปรับปรุงความแม่นยำเมื่อเวลาผ่านไป ตัวอย่างเช่น เมื่อใช้ Alexa ระบบจะ “จดจำ” เมื่อเราแก้ไขสิ่งที่เราพูด 

และจะแม่นยำยิ่งขึ้นในการตีความเสียงของเรา อัลกอริธึมส่วนใหญ่ยังใช้วิธีการเชิงความน่าจะเป็นเพื่อหาว่าหน่วยเสียงใดมีแนวโน้มที่จะตามกันมากที่สุด ซึ่งเรียกว่าแบบจำลองมาร์คอฟที่ซ่อนอยู่วิธีการแบบขั้นตอนเดียวที่เรียกว่า “การเรียนรู้เชิงลึกแบบ  กำลังได้รับความนิยมและถูกนำมาใช้ในเทคโนโลยี

การจดจำเสียงในปัจจุบัน สิ่งนี้ใช้อัลกอริธึมการเรียนรู้เดียวเพื่อเปลี่ยนจากสัญญาณไฟฟ้าที่เป็นตัวแทนของเสียงไปเป็นข้อความถอดเสียงโดยไม่ต้องแตกโทรศัพท์ออเดรย์และตัวเก็บประจุเรื่องราวของวิธีที่เซ็นเซอร์อะคูสติกเข้าถึงความไวพิเศษดังกล่าวได้เริ่มขึ้นในปลายศตวรรษที่ 19 เมื่อเซ็นเซอร์

อะคูสติกตัวแรก ไมโครโฟนแบบคาร์บอนหรือ “แบบสัมผัส” ได้รับการพัฒนาโดยอิสระโดยนักประดิษฐ์สามคน ได้แก่ ในสหรัฐอเมริกา  ใน อังกฤษ. อุปกรณ์เหล่านี้ประกอบด้วยเม็ดคาร์บอนที่ถูกอัดระหว่างแผ่นสัมผัสโลหะสองแผ่นด้วยแรงดันไฟฟ้าที่ใช้ทั่วแผ่น คลื่นเสียงที่เข้ามาทำให้แผ่นไดอะแฟรม

แผ่นใดแผ่นหนึ่งสั่น ในระหว่างการบีบอัด เม็ดกราไฟต์จะเปลี่ยนรูป เพิ่มพื้นที่สัมผัสระหว่างแผ่นเพื่อให้ความต้านทานของการตั้งค่าลดลง และกระแสเพิ่มขึ้น การเปลี่ยนแปลงเหล่านี้เมื่อไดอะแฟรมเคลื่อนที่หมายความว่าเสียงจะถูกเข้ารหัสด้วยกระแสไฟฟ้าอย่างไรก็ตาม จนกระทั่งปี 1952 

เทคโนโลยีการจดจำเสียงได้รับการพัฒนาขึ้นเป็นครั้งแรก ทีมงานของ ในสหรัฐอเมริกาได้สร้างโปรแกรมชื่อ ซึ่งเป็นเครื่องจดจำตัวเลขอัตโนมัติ ซึ่งสามารถเข้าใจตัวเลข 0-9 ที่พูดในโทรศัพท์มาตรฐาน (ซึ่งน่าจะมีไมโครโฟนคาร์บอน ). สามารถใช้ออเดรย์สำหรับการโทรแบบแฮนด์ฟรีได้ แต่ต้องได้รับการฝึกฝน

ให้ฟังเสียงของผู้ใช้ และต้องใช้ห้องที่เต็มไปด้วยอุปกรณ์อิเล็กทรอนิกส์จึงจะทำงานได้ในขณะที่ด้านคอมพิวเตอร์ของการจดจำเสียงเห็นได้ชัดว่ามาไกลตั้งแต่  แต่เซ็นเซอร์เสียงก็ผ่านการพัฒนาอย่างเข้มงวดเช่นกัน การออกแบบที่หลากหลาย เช่น ไมโครโฟนแบบริบบิ้น ไมโครโฟนไดนามิกและคาร์บอน

มีเข้ามา

และล้าสมัย แต่สิ่งที่ได้รับชัยชนะสำหรับการจดจำเสียงคือตัวเก็บประจุหรือ “คอนเดนเซอร์” เซ็นเซอร์ เดิมทีพัฒนาขึ้นในปี 1916การออกแบบขึ้นอยู่กับข้อเท็จจริงที่ว่าแรงดันไฟฟ้าทั่วตัวเก็บประจุขึ้นอยู่กับระยะห่างระหว่างแผ่น ด้วยเหตุนี้ เซ็นเซอร์จึงมีแผ่นรองหลังแบบอยู่กับที่และไดอะแฟรมเคลื่อนที่ 

ซึ่งชาร์จด้วยแรงดันไฟฟ้าภายนอก เมื่อกะบังลมสั่นจากคลื่นเสียงที่เข้ามาได้พัฒนาเซ็นเซอร์ตัวเก็บประจุเพิ่มเติมในปี 1962 โดยใช้ไดอะแฟรมอิเล็กเตรตเพื่อสร้างไมโครโฟนคอนเดนเซอร์อิเล็กเตรต (ECM) วัสดุอิเล็กเตรต เช่น เทฟล่อน มีประจุไฟฟ้าที่พื้นผิวอยู่ก่อนแล้ว ซึ่งหมายความว่าวัสดุอิเล็กเตรต

จะคงแรงดันไฟฟ้าไว้ทั่วตัวเก็บประจุ จึงช่วยลดกำลังไฟฟ้าเข้าที่จำเป็น ECM ที่มีเส้นผ่านศูนย์กลางประมาณ 3–10 มม. ครองตลาดไมโครโฟนทั่วไปมาเกือบ 50 ปี แต่การย้ายไปสู่อุปกรณ์ขนาดกะทัดรัดทำให้อัตราส่วนสัญญาณต่อสัญญาณรบกวนลดลงและความเสถียรลดลง โดยเฉพาะอย่างยิ่ง

ในสภาพแวดล้อมที่มีอุณหภูมิแปรปรวน เมื่อพูดถึงการจดจำเสียง ECM จึงถูกแทนที่ด้วยไมโครโฟนแบบคาปาซิทีฟระบบเครื่องกลไฟฟ้าขนาดเล็ก (MEMS) เป็นส่วนใหญ่ เพียง 20–1,000  μเมตร อุปกรณ์เหล่านี้มักเป็นอุปกรณ์ที่คุณพบในลำโพงอัจฉริยะ เซ็นเซอร์ MEMS แตกต่างจาก ECM ในวงจรภายใน โดยเฉพาะอย่างยิ่งตรงที่เซ็นเซอร์จะแปลงสัญญาณจากอะนาล็อกเป็นดิจิตอล

แนะนำ 666slotclub / hob66