Be My Eyes 是丹麦的一家初创企业,旗下同名APP平台通过召集全世界的人工志愿者来协助视障用户完成日常生活琐事,但并非所有的视障用户都会愿意跟陌生人共享个人信息和生活场景,除了隐私安全还涉及到视障群体的自尊心问题,这也导致了这一应用推进遇到了瓶颈。 去年接入GPT-4后,Be My Eyes就率先推出一项“虚拟志愿者”(Be My AI)功能,客户反响迅速提升。用户与AI关于电视内容的“对话” 来自美国的盲人女孩 Lucy Edwards 分享自己使用Be My Eye的场景:阅读时尚杂志目录、将中文翻译成英文、搜索网上食谱、阅读餐厅菜单等等。此外,Edwards还展示了将Be My AI用作私人教练和伦敦地铁导游的潜力。 盲人女孩 Lucy Edwards 分享自己使用 Be My Eye Edwards表示,AI可以赋予视障人群更大的自主性和私密度,避免了和陌生人沟通带来的尴尬和隐私问题。 国内类似的平台则更加注重应用场景精准化,如基于MOSS大模型而开发的“听见世界”APP,就有根据导航、环境描述、寻找物品等应用场景而设计的向导模式、朋友模式和管家模式。开发团队结合实地测试,模拟视障者真实体验,细节更为精致,能够更好地充当视障人士的智能管家。
手语翻译官
AI 技术普及的数十年来,手语识别转文字一直有较大的技术空白,听障行业存在诸多待攻克的难点 —— 如何在较小空间中准确跟踪手指关节动作、识别其方向和运动轨迹,怎样处理手语特有的语法顺序和省略表达、手语动作间的相似及包含关系等问题。图源|vivo官网 vivo技术研发团队整合 AI 等实现了手语到文本再到语音的流畅互译,在2023年3月正式推出“手语翻译官”功能。目前,已经可以识别1200个手语词汇,准确率80%以上,相当于汉语四级水平。而手语合成部分,已经覆盖了国家通用词典8000以上的词汇,可以实现文字到手语的顺畅翻译。
回望这一年,以GPT-4模型为代表的大模型技术,让AI拥有了深度学习能力,摆脱了“有多少智能就要多少人工”的魔咒;而多模态的识别生成技术,让人机交互方式多元化,帮助老年群体、残障群体更好地使用人工智能。 我们从去年的变化中窥见未来生活的草稿,如今站在技术拐点,除了期待,还有很多关于问题尚未解决,很多技术和应用都还在起跑线,但可以看到一个新的趋势:AI正在改变着商业向善的尺度。 参考资料:Be My Eyes:Be My Eyes integrates Be My AI™ into its first contact center with stunning results.Google:Our progress on generative AI in health.Karya:AI by the people, for the people.Time Magazine:The Indians' startup making AI fairer—while helping the poor.YouTube:Figure status update—OpenAI speech-to-speech reasoning.爱范儿:OpenAI 机器人炸裂登场!ChatGPT 终于有身体了,能说会看还能做家务 。新华网:百度健康首发可交互AI用药说明书,助力适老化改革。 撰文 | Canamy编辑 | 姜舒 国佳佳排版 | 冯莎莎