牛雨離開之後,馮子默可以說已經完成了此次來帝都的所有任務。
原本馮子默打算著在事情辦完之後在帝都遊覽一番,不過現在馮子默卻是改變了主意,因為有了新的計劃要完成。
至於新的計劃,自然是關於翻譯軟件的神助攻了。
而被馮子默視為神助攻的,則是足以與超級語言互譯相媲美的另一樣法寶——“智能語音輸入法”。
現在市麵上做的最好,應用最為廣泛的語音輸入法當數飛音語音輸入法,飛音語音在長句語音識別方麵做的相當不錯,隻要環境不是特別嘈雜,飛音語音可以通過結合上下文的語境方式,基本做到將大段的語音完全識別出來,準確率相當高。
不過馮子默認為,還不夠好,尤其是在短詞匯方麵,比如人名、術語、同音詞組等方麵飛音語音都表現的不盡人意,而且在嘈雜環境的表現更是一場災難!
馮子默想象中的語音輸入法應該更加智能,分辨更加精準,抗幹擾能力更加強大,足以同人耳媲美,甚至比人耳具有更強分辨力的軟件。
簡單來說,就是一種具有真正智能,可以在使用過程中根據用戶的使用習慣不斷進行調整和深度學習,最終達到完美識別用戶語音的境界。
對於準備打造的這款智能語音輸入法的核心——智能模塊,馮子默可以說是胸有成竹,畢竟有著之前版本的經驗以及在扶桑開發的那款車輛應急係統都用到了類似的智能模塊。
唯一讓馮子默有些頭痛的是對千差萬別的用戶群語音數據的收集和識別。
畢竟馮子默主打的是智能識別,但是哪怕再智能,也是需要進行深度的語言學習。
普通話,作為全國推廣的官方語言自是需要首先被攻克的,不過普通話對馮子默想要打造的智能識別係統來說,恰恰最沒有難度。
畢竟普通話有著規範且健全的發音準則,隻要這些準則都深度學習一遍,就可以在相當程度上對普通話進行精準識別。
然後就是各地方言,在初步評估中,馮子默將方言分為兩類,一類是粵語、閩南語這種總結出了類似於普通話那種成體係的發音規則,並且有一套所謂正宗發音原則的方言。
另一類則是隻有語言的使用者可以意會,卻是不能言傳他人的方言。
對於第一類方言,倒是可以和普通話同樣對待。
但是第二類方言就不能如此省事兒了。
能聽懂普通話和第一類方言,是馮子默對智能語音識別係統的最基本要求。
在此基礎上,馮子默將對第二類方言的識別與帶有地方口音的普通話或者第一類方言的識別作為智能語音識別係統的需要具備的進階版能力。
畢竟聽的懂標準版的普通話乃至特色方言都沒什麽大不了,能聽懂帶有地方口音甚至個人口音的普通話以及特色方言才算牛。
馮子默之前就聽過一個段子:說一位南閩籍的老板將一位員工叫到辦公室,讓他幫你買仙人掌,還特意交代要“黃糊色”。
員工當時就懵了,心中更是嘀咕著:黃糊色是的什麽顏色,沒見過仙人掌有黃糊色的啊!
老板看著一臉懵然的員工,又特意指著電腦桌麵圖案中高懸的太陽再次強調道:黃糊色、黃糊色!
員工暈暈乎乎的走出老板辦公室,滿麵愁容,口中還一直念叨著“黃糊色”。
恰在此時,一位南閩籍同事問這位員工發生了何時,員工將事情完整的講述了一遍,還一本正經的問同事,黃糊色到底是什麽顏色。
這位南閩籍的同事卻是哈哈大笑道:不是黃糊色,是防!輻!射!
段子雖然是段子,但馮子默深知這個段子反應的卻是客觀現狀,不僅南閩群眾“h”、“f”不分,自己作為千湖省的一員,哪怕在國家普通話考核中拿到了二級甲等的證書,同樣經常在不經意間在發音上弄混“h”與“f”,至於像“灰化肥會揮發”這種簡短的繞口令更是從來沒有清晰、快速、正確的念出來過。
而諸如此類的口音遷移問題在各種版本的普通話和方言中數不勝數。
因此,想要具備分辨不同口音和不成體係的方言這種能力,馮子默能想到的唯一辦法就是深入到群眾中去學,向使用這種語言的人群去學。
當然,不是馮子默自己去學習,而是讓準備打造的這款智能語音識別係統去學習。
至於智能語音識別係統如何到群眾中去學習地道的當地語言,自然隻能靠語音數據庫了。
要說語音數據庫,馮子默第一個想到的卻不是飛音集團,盡管飛音集團所研發的語音輸入早已進入市場多年,不僅有著不少忠實擁躉,更是有著數量眾多的語音輸入用戶,勢必收錄有數量龐大且豐富的語音樣本。
不過,飛音語音雖然支持普通話以及數十種方言,但是對於口音問題和第二類方言,飛音輸入法自身都不能識別,自然也就沒人會在使用飛音輸入法的時候說不能被識別的方言。
因此,在這一類型的鄉音、方言的語音標本,飛音集團應該也是寥寥。
真正被馮子默第一個想到擁有這種資源的公司則是國內社交領域的絕對霸主——迅騰,該公司旗下的qiq和微書信兩款應用軟件占據了社交領域絕大部分份額,可謂是無孔不入,裝機量更是遙遙領先。
馮子默具體看中的正是具有發送語音消息功能的微書信,微書信作為社交領域的兩座高峰之一,幾乎成為了一款裝機必備軟件。
坐擁數以億計的龐大用戶群,微書信自是通過語音消息功能收錄有近乎國內所有語種、口音的語音標本,而且數據量極為豐富。
至於社交領域的另一座高峰qiq,雖然也有相同的功能,但是馮子默認為微書信的語音消息的使用頻率應該高於qiq。
而且,更重要的是,馮子默認為使用微書信語音消息的人群分布的更為廣泛,更具有普遍代表性。
當然,作為語音標本數據庫,論語音標本的豐富程度,還有好幾家公司可以與迅騰公司相媲美,比如移不動、聯不通,電不信這三大通訊運營商。
雖然這三家公司不會對所有電話進行錄音,但是如果他們想獲取語音標本,那完全是不費吹灰之力,而且可以做到精準錄音,各種語音標本自是可以做到應有盡有。
不過這三家公司好歹都是國企,節操在一定程度上還是有的,況且大瑞憲法第四十條明確規定:大瑞公民的通信自由和通信秘密受法律的保護。
馮子默相信,以這三家公司的高傲,絕不會彎下身段與自己搞合作,更是不會鋌而走險冒著違法的風險,給自己提供語音標本。
是以,馮子默將最理想的合作對象定為迅騰公司,雖然在一定意義上來說,微書信中的用戶語音信息應該也是受到法律保護,哪怕是迅騰公司自己也不能輕易查看。
但是馮子默相信,辦法總比困難多,隻要付出足夠的利益,肯定會有辦法的。
其實在馮子默看來,哪怕近乎可以聽懂所有語音的進階版語音輸入法也就勉強達到行業領先標準,仍談不上智能,更不能說完美。
所謂智能,在馮子默的構想中,至少要善解人意,並且可以在複雜的環境中準確無誤的聽懂用戶說的每一句話、每一個詞、甚至每一個字。
這就要求智能語音的識別不能局限於聽到的這一截語音,如果僅是單截語音,尤其是同音詞匯,甚至同音字,那完全沒法分辨,智能語音必須要有聯係上文和語境進行推理的能力。uu看書 ww.uukashuco
同時,智能程序還需要進行進一步的特異性深度學習,學習的對象不再是寬泛的語音標本,而是要具體到用戶,在用戶使用智能語音的過程中,智能語音就同步進行記憶和學習。
隨著用戶語音使用時長的累計,智能語音的學習程度也隨之逐漸深入,進而對用戶的語言習慣和發音方式進行透徹的解析和模擬,最終達到和用戶自身分辨能力相當的地步。
也就是說,智能語音要做到用戶一句話說出口,隻要用戶自己能聽明白在說什麽,智能語音都可以做出完全一致的識別。
可以說,到了這種程度的語音輸入法,雖然不能說比用戶自己更懂用戶,但絕對可以說是比用戶以外的任何人都要懂用戶說的話。
也隻有達到這種境界的軟件,才被馮子默認為可以稱得上智能。
不過,哪怕到達這種境界,依然不是馮子默所想的那種完美狀態。
馮子默構想的完美狀態智能語音輸入法應該具有比用戶更懂用戶的能力。
也就是用戶一句話說出口,有時可能會出現口誤或者其他表述不清或不當的情形,這個時候智能語音輸入法可以在保留用戶原意的基礎上,根據用戶的日常用語習慣進行自動糾錯和調整。
不過馮子默深知,哪怕他將智能語音輸入法編寫出來,想進化到完美形態也是需要一個漫長的過程,當然這些都是後話。
卻說馮子默在完成了對智能語音輸入法的整體構思和預期設定後,就開始埋頭編起了這款在未來具有統治地位的語音智能輸入法,
原本馮子默打算著在事情辦完之後在帝都遊覽一番,不過現在馮子默卻是改變了主意,因為有了新的計劃要完成。
至於新的計劃,自然是關於翻譯軟件的神助攻了。
而被馮子默視為神助攻的,則是足以與超級語言互譯相媲美的另一樣法寶——“智能語音輸入法”。
現在市麵上做的最好,應用最為廣泛的語音輸入法當數飛音語音輸入法,飛音語音在長句語音識別方麵做的相當不錯,隻要環境不是特別嘈雜,飛音語音可以通過結合上下文的語境方式,基本做到將大段的語音完全識別出來,準確率相當高。
不過馮子默認為,還不夠好,尤其是在短詞匯方麵,比如人名、術語、同音詞組等方麵飛音語音都表現的不盡人意,而且在嘈雜環境的表現更是一場災難!
馮子默想象中的語音輸入法應該更加智能,分辨更加精準,抗幹擾能力更加強大,足以同人耳媲美,甚至比人耳具有更強分辨力的軟件。
簡單來說,就是一種具有真正智能,可以在使用過程中根據用戶的使用習慣不斷進行調整和深度學習,最終達到完美識別用戶語音的境界。
對於準備打造的這款智能語音輸入法的核心——智能模塊,馮子默可以說是胸有成竹,畢竟有著之前版本的經驗以及在扶桑開發的那款車輛應急係統都用到了類似的智能模塊。
唯一讓馮子默有些頭痛的是對千差萬別的用戶群語音數據的收集和識別。
畢竟馮子默主打的是智能識別,但是哪怕再智能,也是需要進行深度的語言學習。
普通話,作為全國推廣的官方語言自是需要首先被攻克的,不過普通話對馮子默想要打造的智能識別係統來說,恰恰最沒有難度。
畢竟普通話有著規範且健全的發音準則,隻要這些準則都深度學習一遍,就可以在相當程度上對普通話進行精準識別。
然後就是各地方言,在初步評估中,馮子默將方言分為兩類,一類是粵語、閩南語這種總結出了類似於普通話那種成體係的發音規則,並且有一套所謂正宗發音原則的方言。
另一類則是隻有語言的使用者可以意會,卻是不能言傳他人的方言。
對於第一類方言,倒是可以和普通話同樣對待。
但是第二類方言就不能如此省事兒了。
能聽懂普通話和第一類方言,是馮子默對智能語音識別係統的最基本要求。
在此基礎上,馮子默將對第二類方言的識別與帶有地方口音的普通話或者第一類方言的識別作為智能語音識別係統的需要具備的進階版能力。
畢竟聽的懂標準版的普通話乃至特色方言都沒什麽大不了,能聽懂帶有地方口音甚至個人口音的普通話以及特色方言才算牛。
馮子默之前就聽過一個段子:說一位南閩籍的老板將一位員工叫到辦公室,讓他幫你買仙人掌,還特意交代要“黃糊色”。
員工當時就懵了,心中更是嘀咕著:黃糊色是的什麽顏色,沒見過仙人掌有黃糊色的啊!
老板看著一臉懵然的員工,又特意指著電腦桌麵圖案中高懸的太陽再次強調道:黃糊色、黃糊色!
員工暈暈乎乎的走出老板辦公室,滿麵愁容,口中還一直念叨著“黃糊色”。
恰在此時,一位南閩籍同事問這位員工發生了何時,員工將事情完整的講述了一遍,還一本正經的問同事,黃糊色到底是什麽顏色。
這位南閩籍的同事卻是哈哈大笑道:不是黃糊色,是防!輻!射!
段子雖然是段子,但馮子默深知這個段子反應的卻是客觀現狀,不僅南閩群眾“h”、“f”不分,自己作為千湖省的一員,哪怕在國家普通話考核中拿到了二級甲等的證書,同樣經常在不經意間在發音上弄混“h”與“f”,至於像“灰化肥會揮發”這種簡短的繞口令更是從來沒有清晰、快速、正確的念出來過。
而諸如此類的口音遷移問題在各種版本的普通話和方言中數不勝數。
因此,想要具備分辨不同口音和不成體係的方言這種能力,馮子默能想到的唯一辦法就是深入到群眾中去學,向使用這種語言的人群去學。
當然,不是馮子默自己去學習,而是讓準備打造的這款智能語音識別係統去學習。
至於智能語音識別係統如何到群眾中去學習地道的當地語言,自然隻能靠語音數據庫了。
要說語音數據庫,馮子默第一個想到的卻不是飛音集團,盡管飛音集團所研發的語音輸入早已進入市場多年,不僅有著不少忠實擁躉,更是有著數量眾多的語音輸入用戶,勢必收錄有數量龐大且豐富的語音樣本。
不過,飛音語音雖然支持普通話以及數十種方言,但是對於口音問題和第二類方言,飛音輸入法自身都不能識別,自然也就沒人會在使用飛音輸入法的時候說不能被識別的方言。
因此,在這一類型的鄉音、方言的語音標本,飛音集團應該也是寥寥。
真正被馮子默第一個想到擁有這種資源的公司則是國內社交領域的絕對霸主——迅騰,該公司旗下的qiq和微書信兩款應用軟件占據了社交領域絕大部分份額,可謂是無孔不入,裝機量更是遙遙領先。
馮子默具體看中的正是具有發送語音消息功能的微書信,微書信作為社交領域的兩座高峰之一,幾乎成為了一款裝機必備軟件。
坐擁數以億計的龐大用戶群,微書信自是通過語音消息功能收錄有近乎國內所有語種、口音的語音標本,而且數據量極為豐富。
至於社交領域的另一座高峰qiq,雖然也有相同的功能,但是馮子默認為微書信的語音消息的使用頻率應該高於qiq。
而且,更重要的是,馮子默認為使用微書信語音消息的人群分布的更為廣泛,更具有普遍代表性。
當然,作為語音標本數據庫,論語音標本的豐富程度,還有好幾家公司可以與迅騰公司相媲美,比如移不動、聯不通,電不信這三大通訊運營商。
雖然這三家公司不會對所有電話進行錄音,但是如果他們想獲取語音標本,那完全是不費吹灰之力,而且可以做到精準錄音,各種語音標本自是可以做到應有盡有。
不過這三家公司好歹都是國企,節操在一定程度上還是有的,況且大瑞憲法第四十條明確規定:大瑞公民的通信自由和通信秘密受法律的保護。
馮子默相信,以這三家公司的高傲,絕不會彎下身段與自己搞合作,更是不會鋌而走險冒著違法的風險,給自己提供語音標本。
是以,馮子默將最理想的合作對象定為迅騰公司,雖然在一定意義上來說,微書信中的用戶語音信息應該也是受到法律保護,哪怕是迅騰公司自己也不能輕易查看。
但是馮子默相信,辦法總比困難多,隻要付出足夠的利益,肯定會有辦法的。
其實在馮子默看來,哪怕近乎可以聽懂所有語音的進階版語音輸入法也就勉強達到行業領先標準,仍談不上智能,更不能說完美。
所謂智能,在馮子默的構想中,至少要善解人意,並且可以在複雜的環境中準確無誤的聽懂用戶說的每一句話、每一個詞、甚至每一個字。
這就要求智能語音的識別不能局限於聽到的這一截語音,如果僅是單截語音,尤其是同音詞匯,甚至同音字,那完全沒法分辨,智能語音必須要有聯係上文和語境進行推理的能力。uu看書 ww.uukashuco
同時,智能程序還需要進行進一步的特異性深度學習,學習的對象不再是寬泛的語音標本,而是要具體到用戶,在用戶使用智能語音的過程中,智能語音就同步進行記憶和學習。
隨著用戶語音使用時長的累計,智能語音的學習程度也隨之逐漸深入,進而對用戶的語言習慣和發音方式進行透徹的解析和模擬,最終達到和用戶自身分辨能力相當的地步。
也就是說,智能語音要做到用戶一句話說出口,隻要用戶自己能聽明白在說什麽,智能語音都可以做出完全一致的識別。
可以說,到了這種程度的語音輸入法,雖然不能說比用戶自己更懂用戶,但絕對可以說是比用戶以外的任何人都要懂用戶說的話。
也隻有達到這種境界的軟件,才被馮子默認為可以稱得上智能。
不過,哪怕到達這種境界,依然不是馮子默所想的那種完美狀態。
馮子默構想的完美狀態智能語音輸入法應該具有比用戶更懂用戶的能力。
也就是用戶一句話說出口,有時可能會出現口誤或者其他表述不清或不當的情形,這個時候智能語音輸入法可以在保留用戶原意的基礎上,根據用戶的日常用語習慣進行自動糾錯和調整。
不過馮子默深知,哪怕他將智能語音輸入法編寫出來,想進化到完美形態也是需要一個漫長的過程,當然這些都是後話。
卻說馮子默在完成了對智能語音輸入法的整體構思和預期設定後,就開始埋頭編起了這款在未來具有統治地位的語音智能輸入法,