藏语大模型亮相北京科博会 弥合AI时代“数字鸿沟”
对着智能鼠标用藏语提问,数字鸿沟大模型识别语音,藏语并以藏语思考作答。大模第二十八届中国北京国际科技产业博览会(简称北京科博会)8日至10日举行,型亮相北这是京科记者在现场看到的一幕。 “通用大模型大多基于汉语、弥合英语等语言训练,时代在藏语理解、数字鸿沟生成等方面使用体验不够好,藏语”从事藏语大模型研发的大模西藏大学博士研究生才让东知说,“通用大模型给出的型亮相北回答经常缺乏藏语的自然语感与原生韵味,有明显的京科人工转码痕迹。” 藏语大模型使用藏语语音语料训练、弥合以藏语思维思考,时代能弥补这一缺憾。数字鸿沟在北京科博会现场展示的藏语大模型已经可以完成很多日常任务:“帮我写一份买卖牦牛的合同”“写一首赞美父母的诗歌”“长期吃素的人应该吃什么补充营养”…… 藏语大模型“DeepZang”的产品部负责人多吉美久介绍,“DeepZang”收集藏汉平行精准语料近7000万条、采集超过30500小时藏语语音语料,涵盖卫藏、康巴、安多三大藏语方言区。 多吉美久说,不同藏语方言地区之间文字相通,但口语差异较大。用各大藏语方言区语音语料训练AI,AI就能实现藏语的跨方言交流。在国家知识产权局网站上,“DeepZang”开发方——西藏觉罗数字产业管理有限公司申请的一项专利显示,该公司的一项技术通过将声纹识别与方言分类相结合,能有效解决方言差异导致的沟通困难问题。 5月8日,一名外国观众在北京科博会上用智能鼠标体验藏语大模型。新华社发 在洛桑顿玉看来,良好的跨方言语音识别能力,能有效降低藏语大模型的使用门槛,“不需要有很高的藏语文字水平,通过说话就可以使用AI,这能帮助到更多人”。洛桑顿玉在西藏自治区山南市从事藏汉翻译工作,他跟同事已经习惯在工作中使用藏语大模型,“以前需要两三个人分工合作,花40分钟翻译完的稿子,现在有了AI辅助,一个人20多分钟就可以完成”。 觉罗数字提供的信息显示,“DeepZang”目前拥有用户30多万人。其中,18至40岁青年用户占比超过70%。“我们的用户主要分布在西藏、青海、四川和甘肃等地,不少用户生活在比较偏远的地方。”多吉美久说。 西藏已经实现主电网覆盖所有县(区、市),所有乡镇、70%行政村通达5G网络。有了电力和网络的支撑,藏语AI能为更多藏语使用者提供帮助。 “从可用到好用,还有很长的路要走。”多吉美久说。一些用户反馈,用“DeepZang”进行几轮问答后,软件便提示“token余额不足”。这也是他们参展科博会的原因之一——寻求合作,以解决目前面临的算力成本高、资金压力大、商业闭环尚未形成等问题。 这是觉罗数字第一次参加科博会。在公司董事长旦增罗布看来,参加科博会能够帮助公司更好地融入全国科技创新生态。 藏语大模型对藏语使用者和不懂藏语的人分别意味着什么?藏语AI对此作答:为藏语使用者提供新时代的新工具,搭建藏语与其他语言之间的桥梁。 新华社记者郭沛然
- 最近发表
- 随机阅读
-
- 无忧传媒:与王暖暖确定解约;王暖暖:还没签字
- 俄罗斯驻日大使:俄日关系进入“冰河期”
- 重庆A级纳税人超10万户 符合条件年底前可申请信用修复
- 港股午评:恒生指数跌0.29%,恒生科技指数涨0.04%
- 新股上市大涨!中一签最高赚4.8万!
- “榴莲自由”,真的要来了
- 泡泡玛特将在5月13日举行2026年一季度业务更新电话会
- 陇拍客丨平凉师生:“校园农场”体验劳动快乐
- 美国一客机撞上一名闯入跑道的行人致其死亡,监控视频曝光
- 迎"大考"闯"三关", 良种良法筑牢小麦稳产防线
- 领益智造首批AI算力服务器电源量产交付
- 11校联动惠民,这届大学生展演季以青春潮涌点亮“上海之根”
- 《从投入到产出:金融科技驱动银行业务增长的价值与路径研究》课题发布:为科技赋能锚定投入价值产出的度量
- 赢下国家德比,巴萨踏着老对手实现联赛卫冕,内忧外患的皇马亟待重建
- 中央巡视组原副部级巡视专员许传智被逮捕、提起公诉
- 环境向好 生态生金 万鸟翔集的“山城图景”
- 长吉城际部分动车组5月23日起实行全席别票价折扣优惠
- 中国乒协主席王励勤:国乒圆满完成任务 收获非常大
- 国家广播电视总局:4月经备案的全国国产电视动画片为51部、9659分钟
- 美卫生官员:涉疫邮轮17名美国人中一人病毒检测呈阳性
- 搜索
-
- 友情链接
-