科技拓展公益事业 让残障群体共享信息时代的阳光

来源:光明日报 日期:2021-03-20

  “打造一个‘盲人版’的淘宝,商业成本是非常高的。”王永攀解释说,“淘宝系统非常复杂,再全方位添加一层无障碍结构,在投入开发人员、增加服务器之外,还要面对系统稳定性、安全性的挑战。”

  那么,这个事情做不做?

  “团队是没有犹豫的。”王永攀说,“我们不能只做锦上添花的事情。对视障者而言,这具备着雪中送炭的意义,可以实实在在地帮助他们融入社会、参与社会。”

  完成这项工作,到底有多难呢?

  “网页上每天同时在架图片达500多亿张,类型包括广告图、商品图、表格图、图文注解图等。这就需要将文字、图片以合理顺序进行组织后,再为视障人士阅读,帮助他们正常理解。”王永攀说,“另一个挑战在于,信息转换一定要极度准确,因为一个微小的错误,都会给盲人造成很大的麻烦。”

  夜以继日,“读光”团队不断突破原有技术的局限,终于在2018年“双十一”前成功为手机淘宝搭建了无障碍结构。后来,这一服务又推广到飞猪、咸鱼、支付宝、饿了么等平台,在更大范围让视障者享受到信息时代的便利。

  “无障碍功能的开发,要深刻体察用户的真实需要。”达摩院视觉实验室“读光”产品经理傅诗楹介绍,针对残障群体,“读光”团队用文字图片识别技术,还开发了很多智能助残辅具产品。比如,团队与浙江大学合作,正在研发一款“读书灯”,灯上有一个摄像头,照到文字上即可用声音读出来,极大方便了盲人的学习与阅读。还有一款“智能手杖”,能够精确识别周边环境,并用语音提示出来,从而更好地帮助盲人走出家门,回归社会。

  “信息时代的阳光,必须照进残障群体的生活。”王永攀说,“这才是科技进步的应有之义。”

  3、让无助者感到:这个世界在关心着他

  对一个在城市辛苦打拼的人来说,语音导航起的作用其实不只是导航。

  “那天回家时超累超暴躁,这时手机导航里李佳琦说:‘佳琦的女孩一定要一直开心哦。’那一刻,我的心情顿时缓和了下来。”这是一位网友的感慨。

  为什么现在的机器语音开始有了“感情”?

  “以前通用语音合成,以信息传达为主,声音是非常冰冷的,比如医院叫号、语音报站等。但我们做的项目多了,就感到视障群体对声音非常敏感,他们渴望被温暖地对待。”达摩院语音实验室语音合成算法负责人李昊说,“技术的进步,要有社会责任感,让温暖的事情发生。”

  鄢志杰说:“我们的语音合成技术与人工智能结合,已经可以实现很高水平的人机对话。达摩院在这方面做得非常前沿,已经通过准图灵测试,合成语言可以很好地表达情感、交流信息。”

  “正因如此,相关技术的应用范围越来越广。”李昊介绍,“例如,只要有一分钟左右的语料素材,我们就可以将讲故事的声音合成为家长的,用于孩子的睡前伴读。”

  这一技术还可以帮助一些视力下降的老人或颈椎不好暂时不方便看文字的人。在非常特殊的情况下,这一技术也可以帮助一些失去亲人的人,为他们保留一个再次听到逝者声音甚至与其交流对话的渠道,陪伴和慰藉他们,帮助他们慢慢从悲痛中走出来。

  如今,因为达摩院读光团队的努力,数以百万计的视障人士在家中享受着足不出户,购遍全球的互联网新生活。“很多盲人朋友反馈说,‘独立购物、叫外卖解决了生活中的很多问题,让我觉得自己是一个独立的人了’。”傅诗楹说,“真正让用户能体会到科技对他们的关爱,这也让我们更有动力。”

  “团队曾一度想专门给视障群体做一个简化版淘宝,结果盲人朋友们都说不要。”傅诗楹说,“这让我们意识到,残障群体其实希望参与到正常的社会生活中来。无论在线下还是线上,他们都不希望生活在一个封闭的世界里。”

  “信息技术最令人欣慰之处,就是它给每个人带来平等。”鄢志杰说,“这也正是我们始终坚持的原则——让选择变得更容易,但是不能够剥夺任何群体选择的权利。”

    A+
声明:本文转载自其它媒体,转载目的在于传递更多信息,并不代表赞同其观点和对其真实性负责。