读懂婴幼儿语音和图像数据,打造AI宝宝看护管家

发布于:2023-04-18 ⋅ 阅读:(789) ⋅ 点赞:(0)

近年来,婴幼儿行业已经发展到深水区,资本加码使得婴幼儿市场越来越标准化、规模化,发展路线也更加清晰、明确。

2017年以后,婴幼儿行业投融资三大核心趋势为:内容创业、人工智能和母婴新零售。很明显,人工智能早已被市场玩家看中,婴幼儿+AI的模式成为婴幼儿行业发展成熟的必然结果。

婴幼儿产品和服务的转型升级离不开AI

婴幼儿(0~3岁)群体的特点是,无法用语言精确表达其意图,行动的不确定性和危险性高。所以人工智能技术在婴幼儿产品与服务行业的落地应用有很大价值,不仅让宝宝得到了更加人性化的看护,也在一定程度上减轻了父母看护压力。

具体而言,针对婴幼儿的人工智能,主要包括人脸识别和语音检测技术。

人脸识别

多家人工智能公司研发了人工智能婴儿监视器密切关注婴儿的情况。这类摄像系统24小时收集婴幼儿数据,并在发现他们哭闹、呕吐或痛苦的迹象时向父母发出警报。

谷歌去年获得了一项婴儿AI监控专利,这款设备除了可以监控婴儿活动外,还可以在发现异常情况后提醒家长或护理人员。在专利文件中谷歌表示,这一设备还能够追踪婴儿眼球、智能判断出婴儿的动作并知道自己应该在什么时间范围内监控婴儿。

语音检测

对宝宝的哭声进行辨别,能够帮助父母及时发现宝宝的异常情况。

知名母婴家庭服务平台宝宝树致力于打造“母婴界Siri”,率先推出了婴幼儿智能语音助手“小树机器人”,展开了智能交互布局的尝试。包括独有的婴儿哭声识别在内,宝宝树的AI应用已取得阶段性成果。

语音检测对儿童医学研究也有重要意义。由于婴幼儿不懂表达,“自述”这一判定疾病和采取治疗措施的指标在儿科领域通常难以获取。通过研究婴幼儿声音等外在表现,用AI的方式得到更为精准的定位,有利于儿科治疗的对症。

语音检测不仅有助于解决看护问题,还有利于儿科治疗

但纵观当前婴幼儿人机智交互的实践可知:优质的交互体验并非一朝一夕的工程,其背后离不开技术成熟、内容搭建和场景数据三个重要因素的支撑。

数据堂在深刻理解婴幼儿看护场景的基础上,设计并研发了婴幼儿人脸识别和语音检测数据,助力现有AI技术更精准地定位婴幼儿用户需求,快速调取个性化数据与知识内容匹配,实现更加优化的交互。

数据堂注重伦理建设,与每一位被采集者的监护人均签署了授权协议,保障了数据的安全合规。

人婴幼儿啼哭手机采集语音数据

该数据涵盖201名婴幼儿每人多段啼哭声,其中男孩105人,女孩96人,覆盖了0~3岁年龄段的儿童,为智能家居中检测儿童哭声提供了数据支持。

20人婴幼儿笑声手机采集语音数据

参与录制的婴儿每人录制多段笑声,包含婴儿笑声的部分计入有效时长,标注人员根据音频标注出了实际出现笑声的各时间段。该数据可用于声音识别的模型训练或算法研究和智能家居场景下的儿童笑声建模。

5,030人55,670张婴幼儿人脸采集数据

数据采集了0~3岁的2899名男孩和2131名女孩的人脸图像,照片中的人脸为清晰完整的正面人脸,可以看到双眼的外眼角,人脸在图像中的占比在20%以上。以年龄和性别准确度为准,数据的采集精度超过了97%。

52人208张婴幼儿表情识别数据

工作人员采集了52名婴儿每人4张表情照片,其中男孩35人,女孩17人,表情种类包括正常、高兴、哭和睡觉。照片上的人脸清晰可见,人脸能够看到双眼的外眼角。

标注人员对被采集人的性别、人种和年龄,以及照片中对应的表情种类进行标注。按照采集表情准确度为准,精准度超过97%,标签明明准确率也在97%以上。

人工智能在婴幼儿看护场景下的落地应用似乎给父母们带来了福音,但仍面临着识别准确率降低、警报不及时等问题。以现阶段的AI发展状况,显然不能解决所有的问题。但是如果能解决其中的一部分,提升效率,就可以发挥婴幼儿+AI的价值,这对大多数年轻父母来说不失为一种安慰。


网站公告

今日签到

点亮在社区的每一天
去签到