對著智能鼠標用藏語提問,大模型識別語音,并以藏語思考作答。第二十八屆中國北京國際科技產業(yè)博覽會(簡稱北京科博會)8日至10日舉行,這是記者在現場看到的一幕。
“通用大模型大多基于漢語、英語等語言訓練,在藏語理解、生成等方面使用體驗不夠好,”從事藏語大模型研發(fā)的西藏大學博士研究生才讓東知說,“通用大模型給出的回答經常缺乏藏語的自然語感與原生韻味,有明顯的人工轉碼痕跡?!?/p>
藏語大模型使用藏語語音語料訓練、以藏語思維思考,能彌補這一缺憾。在北京科博會現場展示的藏語大模型已經可以完成很多日常任務:“幫我寫一份買賣牦牛的合同”“寫一首贊美父母的詩歌”“長期吃素的人應該吃什么補充營養(yǎng)”……
藏語大模型“DeepZang”的產品部負責人多吉美久介紹,“DeepZang”收集藏漢平行精準語料近7000萬條、采集超過30500小時藏語語音語料,涵蓋衛(wèi)藏、康巴、安多三大藏語方言區(qū)。
多吉美久說,不同藏語方言地區(qū)之間文字相通,但口語差異較大。用各大藏語方言區(qū)語音語料訓練AI,AI就能實現藏語的跨方言交流。在國家知識產權局網站上,“DeepZang”開發(fā)方——西藏覺羅數字產業(yè)管理有限公司申請的一項專利顯示,該公司的一項技術通過將聲紋識別與方言分類相結合,能有效解決方言差異導致的溝通困難問題。

5月8日,一名外國觀眾在北京科博會上用智能鼠標體驗藏語大模型。新華社發(fā)
在洛桑頓玉看來,良好的跨方言語音識別能力,能有效降低藏語大模型的使用門檻,“不需要有很高的藏語文字水平,通過說話就可以使用AI,這能幫助到更多人”。洛桑頓玉在西藏自治區(qū)山南市從事藏漢翻譯工作,他跟同事已經習慣在工作中使用藏語大模型,“以前需要兩三個人分工合作,花40分鐘翻譯完的稿子,現在有了AI輔助,一個人20多分鐘就可以完成”。
覺羅數字提供的信息顯示,“DeepZang”目前擁有用戶30多萬人。其中,18至40歲青年用戶占比超過70%?!拔覀兊挠脩糁饕植荚谖鞑亍⑶嗪?、四川和甘肅等地,不少用戶生活在比較偏遠的地方?!倍嗉谰谜f。
西藏已經實現主電網覆蓋所有縣(區(qū)、市),所有鄉(xiāng)鎮(zhèn)、70%行政村通達5G網絡。有了電力和網絡的支撐,藏語AI能為更多藏語使用者提供幫助。
“從可用到好用,還有很長的路要走。”多吉美久說。一些用戶反饋,用“DeepZang”進行幾輪問答后,軟件便提示“token余額不足”。這也是他們參展科博會的原因之一——尋求合作,以解決目前面臨的算力成本高、資金壓力大、商業(yè)閉環(huán)尚未形成等問題。
這是覺羅數字第一次參加科博會。在公司董事長旦增羅布看來,參加科博會能夠幫助公司更好地融入全國科技創(chuàng)新生態(tài)。
藏語大模型對藏語使用者和不懂藏語的人分別意味著什么?藏語AI對此作答:為藏語使用者提供新時代的新工具,搭建藏語與其他語言之間的橋梁。
版權聲明:凡注明“來源:中國西藏網”或“中國西藏網文”的所有作品,版權歸高原(北京)文化傳播有限公司。任何媒體轉載、摘編、引用,須注明來源中國西藏網和署著作者名,否則將追究相關法律責任。