搜狗推出“唇语识别”技术‘PG电子’
发布时间:2023-12-17 点击量:579
本文摘要:从键盘点字到触控屏,再行到现在的语音交互和手势交互,人工智能技术的发展正在促成嵌入式方式向更为多元化方向变革。从键盘点字到触控屏,再行到现在的语音交互和手势交互,人工智能技术的发展正在促成嵌入式方式向更为多元化方向变革。日前,搜狗又发售一种嵌入式新技术——唇语辨识,这也是业内首个公开发表展示的唇语识别系统。通过机器视觉辨识,不必听得声音,只能靠辨识说出人唇部动作,就能理解说出者所说的内容。
与语音辨识有所不同,唇语辨识是一项基于机器视觉与自然语言处置于一体的技术,因此在研发可玩性上比语音辨识小得多。搜狗首创了简单末端到末端深度神经网络技术展开中文唇语序列建模,通过数千小时的现实唇语数据训练而出。在非特定人对外开放口语测试集上,搜狗唇语识别系统早已超过60%以上的准确率,多达Google公布的英文唇语系统50%以上的准确率。在横向场景如车载、智能家居等场景下,搜狗唇语识别系统甚至早已超过90%的准确率。
搜狗唇语辨识技术也在第四届世界互联网大会上亮相,引发普遍注目。当国内大部分企业都扎堆挤满在智能语音、图像识别等领域时,搜狗唇语辨识技术的发售将引导整个行业转入一个全新的发展方向。作为嵌入式的形式之一,未来唇语辨识技术可以辅助语音交互及图像识别,在日常生活、安防、公益等各个领域构建广泛应用。例如在车载场景下,周围噪音过大时会对语音指令产生阻碍,通过唇语辨识技术则可以回避阻碍,确保人车交互的准确性和稳定性。
在安防领域,由于目前多数监控只有摄像头没麦克风,给案情分析带给很多难题,唇语辨识技术可以协助公安人员提供最重要的讲话信息,为公共安全获取有效地反对。此外,唇语辨识技术还能充分发挥极大的公益价值,协助先天性听障人群或老年人,让他们更佳地解读和传达自己。
此外,在日常不便倾听的公共场所也可以确保说出内容的私密性。
本文关键词:PG电子官方网站,PG电子官网,PG电子
本文来源:PG电子官方网站-www.jxgah.com