Google ได้เปิดตัวโปรแกรมใหม่ที่จะพัฒนาการบริการจดจำเสียงที่มีความแม่นยำสูงกว่าที่มีใช้กันอยู่ ซึ่งจะช่วยให้ผู้ใช้สามารถสั่งงานด้วยเสียงในการค้นหาข้อมูลบนInternet ส่ง e-mail หรืออ่าน Facebook ได้สะดวกยิ่งขึ้น
โดยมีการขยายตัวของSmart Phones เป็นตัวการสำคัญที่ทำให้เกิดโครงการนี้จากการที่ปริมาณการใช้ โทรศัพท์มือถือแอนดรอยส์ ในการหาข้อมูลผ่าน Internet มีอัตราเพิ่มขึ้นถึง50% ในเพียงแค่6เดือนสุดท้ายของปี 2010 ทำให้ทางGoogle ตัดสินใจเปิดตัวโครงการการใช้ระบบการสั่งงานด้วยเสียงเพื่อให้ผู้ใช้สามารถใช้ Smart Phone ในการค้นหาข้อมูลได้อย่างสะดวกยิ่งขึ้น
?ข้อมูลส่วนใหญ่บนโลกนี้เกิดขึ้นผ่านทางการพูด และในเมื่อภารกิจของGoogle คือการรวบรวมและบริหารข้อมูลของโลก มันจึงจำเป็นที่จะต้องครอบคลุมไปถึงข้อมูลที่ผ่านการสนทนาด้วย? กล่าวโดย Mike Cohen หัวหน้าโครงการของGoogle
ผู้ที่ใช้งานSmart Phone รุ่นล่าสุดจะสามารถใช้ระบบใหม่ของGoogleที่สามารถจำลักษณะการออกเสียงที่เป็นเอกลักษณ์ของเจ้าของได้โดยการโหลด Application ใหม่ไปใช้ ระบบนี้มีความสามารถที่จะเรียนรู้ลักษณะวิธีการออกเสียงและการพูดของเจ้าของซึ่งจะทำให้มันสามารถเข้าใจคำสั่งเสียงได้แม่นยำมากขึ้น
แต่Googleไม่คิดจะหยุดอยู่แค่ระบบจดจำและแยกแยะเสียงธรรมดาๆเช่นนั้น Google ได้วางแผนที่จะให้คอมพิวเตอร์หรือSmart Phone ของคุณสามารถพูดตอบโต้กับคุณได้ด้วยเดียวที่ดูเป็นธรรมชาติและคล้ายมนุษย์มากกว่าที่เคยเป็นมา โดยได้ทำการซึ้อลิขสิทธิ์โปรแกรมออกเสียงอย่างPhonetic Artsจากบริษัทที่อังกฤษมาใช้ด้วย
แบบจำลองทางภาษาที่ Cohen และทีมงานได้พยายามพัฒนาขึ้นมาตั้งแต่6ปีที่แล้ว โดยอาศัยข้อมูลของผู้ที่เข้าใสใช้งานGoogle กว่า 230ล้านล้านครั้งและผู้เข้ามาใช่ระบบการสั่งงานด้วยเสียงแบบดั้งเดิมกว่าล้านคน ซึ่งมันทั้งกว้างขวางและหลากหลายมากเสียจนถ้าใช้คอมพิวเตอร์ทั่วๆไปเครื่องเดียวในการสร้าง โมเดลเสียงdigitalสำหรับภาษาอังกฤษคงต้องใช้เวลาเป็นศตวรรษแน่ๆ
?สิ่งที่Googleต้องการจะทำต่อระบบสังคมออนไลน์ คือการที่ว่า ผู้คนต้องสามารถพูดคุยกับอุปกรณ์สื่อสาร ระบบค้นหา หรือ Network ได้อย่างสะดวกราวกับเป็นทางเลือกปรกติในการใช้งานอุปกรณ์?
วิธีการออกเสียงการเน้นเสียงและสำเนียงส่วนบุคคลนั้นเป็นจุดที่ยากที่สุดสำหรับระบบแยกแยะเสียง และนั่นคือจุดที่ระบบจดจำเสียงแบบใหม่นี้จะต้องพยายามแก้ปัญหา
แต่มันก็ยังเหลืออีกหลายจุดในการที่จะทำความเข้าใจในการที่จะเข้าใจการออกเสียงทั้งหมดอยู่ดีเพราะการออกเสียงของมนุษย์นั้นมีตัวแปรที่หลากหลายมาก เช่น รูปร่างของปาก ฟัน และ ลำคอ จังหวะในการออกเสียง หูมนุษย์นั้นวิวัฒนาการมาให้สามารถแยกแยะสิ่งเหล่านี้ได้ แต่คอมพิวเตอร์ไม่ได้?ความแตกต่างของแต่ละบุคคลนั้นล้วนแต่ส่งผลถึงเสียงที่เปล่งออกมา?
อ้างอิงจาก Physorg