科技拓展公益事业 让残障群体共享信息时代的阳光

来源:光明日报 日期:2021-03-20

  团队成员在实验室调测设备。资料图片

  语音实验室工程师调测语音售卖机。资料图片

  大年三十,《千手观音》舞者吕晓燕(左)与丈夫一起观看春晚。资料图片

  

  2005年央视春晚上一支舞蹈《千手观音》,让听障者这个群体走入大众关注视野。

  然而,人们不知道的是,坐回电视机前,由于春晚小品相声等实时直播节目没有字幕,《千手观音》舞者们与中国超过2000万听障人士一样,难以与家人共享同一份欢乐。

  改变在2021年发生。春节前夕,由中国聋人协会指导研发、阿里巴巴达摩院免费提供语音技术的一款实时字幕机顶盒,让听障群体第一次看懂了春晚直播。

  科技,正让无声世界变得生趣盎然。

  自组建起,阿里巴巴达摩院人工智能团队就默默投身公益,努力让残障者能够参与到这个世界的对话中来。他们坚信,科技的发展,要让人跨越残障造成的鸿沟,再小的群体,也应该平等享受信息时代的红利。

  1、让听障者听到:这个世界到底在“说”什么

  2021年除夕之夜,在上海家中,《千手观音》舞者吕晓燕第一次看懂了春晚中岳云鹏的相声以及贾玲的小品。

  从1983年央视举办第一届春晚开始,虽然电视从模拟技术发展到数字技术,从标清技术发展到高清、超高清,但春晚直播字幕却一直没有实现。

  “听障群体的世界,不能没有字幕。”吕晓燕说,手语是他们这个群体的通用语言,而字幕能让他们知道,这个世界到底在“说”什么。

  “2020年四五月间,有一个做字幕机顶盒的创业者与我们联系,提出给直播节目加字幕的合作请求。”达摩院语音实验室架构师唐璐说,用智能技术给直播节目同步加字幕看似简单,但一旦出现错字,对电视台来说就是一个播出事故,所以行业一直持审慎态度。

  “另外,在商业上也无利可图,因为聋人群体太小众了,太容易被社会忽视。”唐璐说,“而开发一个安全的算法并提供算力支持,需要很大的成本,对一般研发公司来说,这是无法承受的代价。”

  “对听障者群体来说,如果我们能让实时字幕得以实现,就可以为他们打开一扇连通世界的大门。”唐璐觉得,“这是一个公益项目,总需要有人做。”于是,他写了一个详细的材料,向公司申请,免费开放算力给这个项目。

  不久后,达摩院向这个创业项目开放了免费语音接口。获得支持后,那个创业团队很快弄出一个实时字幕机顶盒,在春节前上线销售。

  “为了达到最好的字幕效果,我们做了大量研发工作,针对新闻、娱乐、访谈等不同节目特点,以及娱乐口语、方言、俗语的特点,做了数十万小时时长的标注,成本至少花了几百万元。”唐璐说。

  “由于字幕的误差小、延时低、便利性强,许多听障人士还利用这款机顶盒上网课、开会、远程办公,将其当作自己的‘社交助手’。”达摩院语音实验室负责人鄢志杰表示,“达摩院将持续输出最先进的语音技术,帮助听障群体消除与外部世界的信息鸿沟,为他们实现无障碍沟通、生活、工作提供长期公益支持。”

  2、让视障者看到:这个世界正在发生着什么

  2020年11月1日零点,数亿“尾款人”开始“双十一”冲浪。在浙江富阳,双目失明的蔡琼卉将手机抓在耳边,读屏速度调快了4倍,手指上下翻飞,抢购、满减、支付。靠耳朵,她在和几亿健康人一起“拼手速”抢购。

  蔡琼卉是中国1700多万视障人群中的一员,像她一样,600多万视障人群已用上智能手机。信息技术,为他们铺就了一条互联网世界的“盲道”。

  而这一切得以实现,要从2017年年底说起。这一天,达摩院视觉实验室“读光”团队负责人王永攀收到一封邮件。致信者是一位盲人,他在邮件中说,希望手机淘宝能让盲人也可以无障碍参与“双十一”抢购。

    A+
声明:本文转载自其它媒体,转载目的在于传递更多信息,并不代表赞同其观点和对其真实性负责。