首頁>>>技術>>>語音應用>>>語音合成(TTS)  語音合成產品

中科院服務器端語音推送系統 盲人也能“上網”

2011/01/25

  中科院計算所研發(fā)的系統叫服務器端語音推送系統;ヂ摼W無障礙閱讀系統只屬于其中的一部分。其它還包括客戶端語音推送系統,即客戶可以以軟件的形式一次性將其裝入電腦系統,在無需其他幫助的情況下,對需要瀏覽的任何網頁進行無障礙閱讀。另外,開發(fā)成功的還包括電話訪問系統,盲人無需上網,直接撥打電話,通過自動語音應答,即可瀏覽網站內容。

  互聯網無障礙閱讀系統在服務器端安裝后,可自動將指定網站內容轉化為語音版,并在用戶瀏覽時將語音推送至普通客戶端瀏覽器。這一系統無需用戶安裝任何附加軟件,用IE等普通瀏覽器即可瀏覽。

  從目前情況看,盲人朋友普遍認為操作很方便。但目前系統主要針對內容型的網站,對像社區(qū)、論壇、搜索、軟件下載等交互性網站的使用,還未添加專門的支持。王博士進一步解釋說:“網站上有什么我們已經呈現了,但是讀者需要什么就呈現什么將是我們下一步需要做的,真正實現人機交互的統一已經不遠。”

  盲人也能上網!

  以視覺呈現為主的傳統互聯網網絡,生硬地拉開了盲人和互聯網的距離,而現今,互聯網無障礙閱讀系統讓我們看到距離不再是問題。

  2010年12月23日,由中國科學院計算技術研究所開發(fā)的面向盲人的互聯網無障礙閱讀系統,在北京市殘疾人福利基金會網站(http://www.bfdp.org.cn)正式上線運行,這方便了視力障礙者獲取互聯網信息。

  人機交互復雜而困難

  以視覺化呈現內容為主的互聯網讓視力障礙者只能望而卻步

  互聯網的產生建起了全球溝通的橋梁,縮短了人與人之間的距離,但一直以來,以視覺化呈現內容為主的互聯網讓視力障礙者只能望而卻步。當前,盲人瀏覽網頁一般采用讀屏軟件(如陽光讀屏軟件、永德讀屏軟件),需要單獨購買和安裝。安裝后通過語音合成技術將屏幕上顯示的網頁文本內容讀出,使盲人通過收聽獲取網頁內容。但是軟件只能根據網頁固有順序朗讀網頁全部內容,耗時長、瀏覽速度較慢。

  另外,當前也有一些語音網站系統,可以將網站內容轉化為語音。但這些系統要求人工設置需要轉換的欄目、內容,并且需要根據網頁內容的變化進行人工更新處理,操作繁瑣復雜。由于操作復雜,且對轉換的網頁內容有一定條件限制,對于較大的網站,事實上只能轉換其中的較少部分。

  不管怎樣,經過以前的研究,至少互聯網向受眾輸出內容時可以將網頁讀出。

  另一方面,視力障礙者在瀏覽時,為操作瀏覽器和控制瀏覽過程,需要記憶包括Windows系統快捷鍵在內的許多快捷鍵組合,人機交互復雜而困難。

  那么,有沒有更快、更便捷的方式讓視力障礙者使用互聯網呢?

  網頁內容智能化分析技術

  在對網頁內容進行智能化分析時,首先可將網頁分類為主題型網頁和目錄型網頁

  “互聯網無障礙閱讀系統在服務器端安裝后,可以對網頁內容進行智能分析,過濾冗余的視覺信息、抽取頁面的主要文本,將HTML頁面轉化為層次樹狀結構,從而幫助用戶快速定位和選擇感興趣的內容! 中科院計算所普適計算中心王向東博士介紹說。

  在對網頁內容進行智能化分析時,首先可將網頁分類為主題型網頁和目錄型網頁。主題型網頁(如某一篇新聞或文章所在的網頁)在經過該系統分析后,抽取主要文本(新聞或文章主體),忽略次要內容及圖像等視覺內容,成為便于視力障礙者使用的簡單文本。而對于像各大網站首頁這樣的目錄型網頁,系統將網頁內容進行自動分塊抽取標題,組織為層次樹狀結構,一步步引導使用者進行所需內容選取。

  網頁內容智能化分析技術,實現了無需專人負責,根據網頁內容,自動對網頁進行內容重組,并且可實時跟蹤網頁的更新。這樣,更好地節(jié)省視力礙障者在互聯網網頁停留時間,改變以往順序朗讀耗時的嚴重缺點,進一步實現高效的“閱讀”。

  語音推送技術

  用IE等普通瀏覽器,視力障礙者即可收聽網站內容
可收聽網站內容

  網頁內容被分塊重組后,語音推送技術即實現了網頁自動閱讀的可能。它將智能化分析后的網站內容,自動轉化為語音版,在用戶瀏覽時推送至普通客戶端瀏覽器。這樣無需用戶安裝任何附加軟件,用IE等普通瀏覽器,視力障礙者即可收聽網站內容。在重新組織為層次樹狀結構的網頁中,視力障礙者無需記憶復雜的快捷鍵,只需簡單根據提示輸入數字,即可進入感興趣的鏈接。通過這種方式,即可降低按鍵負擔,提高網頁瀏覽效率。

  人類的進步來自于技術的不斷發(fā)明和創(chuàng)新;ヂ摼W無障礙閱讀系統利用網頁內容智能解析技術,剔除網頁中次要內容和無用視覺信息,將HTML頁面轉化為層次樹狀結構或抽取其主內容文本,幫助用戶快速定位和選擇感興趣的內容,從而結束了視力障礙者對互聯網使用的慢跑歷程。

  技術推廣成關鍵

  比較棘手的是,要實現這些系統的使用價值,需要得到其他網站或機構的支持。

  “相對于歐美的同類系統,我們的技術也是先進的。總體來說,我們缺的不是技術,是支持!蓖跸驏|博士介紹說。

  據了解,中科院計算所研發(fā)的系統叫服務器端語音推送系統,互聯網無障礙閱讀系統只屬于其中的一部分。其它還包括客戶端語音推送系統,即客戶可以以軟件的形式一次性將其裝入電腦系統,在無需其他幫助的情況下,對需要瀏覽的任何網頁進行無障礙閱讀。另外,開發(fā)成功的還包括電話訪問系統,盲人無需上網,直接撥打電話,通過自動語音應答,即可瀏覽網站內容。

  同時,比較棘手的是,要實現這些系統的使用價值,需要得到其他網站或機構的支持。比如互聯網無障礙閱讀系統,需要有專用的服務器和網址支持。針對客戶端的無障礙閱讀軟件、電話訪問系統這些也都需要合適的合作方,才能實現開發(fā)和推廣。技術的推廣,成為了視力障礙者無障礙人機交互的關鍵。

  互聯網技術的發(fā)展,縮短了人與世界的距離,亦縮短了人與人之間的距離。盲人無障礙閱讀系統促使互聯網文明逐步得以實現。

人民網



相關閱讀:
“互動英語學生版”體驗活動掀起學習英語熱潮 2011-01-21
捷通華聲語音合成技術應用于天行娛樂社區(qū) 2011-01-06
語音合成芯片應用于“農村信息機系統” 2010-12-28
中科院開發(fā)面向盲人的互聯網無障礙閱讀系統 2010-12-27
訊飛為煤礦應急廣播系統裝上安全“芯” 2010-12-27

熱點專題:  語音合成TTS 語音識別ASR