赤ちゃんの泣き声は親を心配にさせたり、イライラさせたりするものです。そんな赤ちゃんの泣き声を人工知能(AI)を用いて聞き分けることで、「正常な泣き声」と「異常な泣き声」を区別するという研究が進められています。

赤ちゃんはお腹が減ったり、病気で体調が悪くなったりすると泣きますが、それだけでなく親の気を引くために泣くこともあります。熟練の親や専門家であれば乳児の泣き声の意味をある程度理解することができるため、泣き声の意味を正確に認識することは可能であると考えられてきました。

そこで、さまざまな意味合いを持つ幼児の泣き声の「周波数的領域における音声特徴」を分析し、「乳児が泣いている理由」を認識しようとしたのが、ノーザン・イリノイ・ユニバーシティの電気工学科で准教授を務めるLichuan Liu氏が率いる研究チーム。

研究チームは線形予測符号を用いて乳児の泣き声から線形予測ケプストラム係数(LPCC)、バーク周波数ケプストラム係数(BFCC)、メル周波数ケプストラム係数(MFCC)といった形で音の特徴を抽出。

さらに、圧縮センシングと呼ばれる方法を用い、抽出した大量のデータを効率的に処理したそうです。音声データは騒々しい環境で録音されたものの場合、必要な要素と不必要な要素が入り混じって処理が困難になりますが、圧縮センシングはまばらなデータに基づいて信号を再構築するというプロセスであるため、騒音混じりの音声データを処理するのに役立つそうです。

これらのデータを処理することで、開発チームは乳児の泣き声を検出・認識可能な自動音声認識機能に基づいた新しいアルゴリズムを開発することに成功しました。このアルゴリズムは乳児の「正常な泣き声」と「異常な泣き声」を区別できるそうで、ひとりの乳児の泣き声を認識することに特化したものというわけではなく、「乳児の泣き声が持つ普遍的な意味合い」を読み取ることができるものとなっているとのこと。

アルゴリズムは乳児が泣いている理由と泣き声がいかに緊急のものであるかをより良く理解するための方法として使用できるとのことで、開発者のLiu氏は「特別な言語のように、さまざまな泣き声の中には健康関連の情報がたくさん存在しており、音の信号の違いが情報を運んでくれます。これらの違いは泣き声の特徴の違いによって表現されており、情報を認識して活用するには特徴を抽出してその中の必要な情報を入手する必要があります」と語っています。

引用元:
赤ちゃんの泣き声の意味をAIで聞き分けることが可能に(Gigazine)