大阪工業大学

Notification

The contents of this website are translated by "Shutto Translation."
Please note that due to the use of automated translation, there may be cases where the translation is not correct.
Additionally, translations may not be provided for some images and PDFs.

We appreciate your understanding.

研究室VOICE self localization:会話音声や音楽から感じとる「印象」を分析する

ロボティクス&デザイン工学部

Profile

ロボティクス&デザイン工学部システムデザイン工学科

脇田 由実教授

ナチュラルインタラクション研究室

日常会話から、その人の加齢に伴う衰えの兆しを察知する

話の理解度があいづち音声の音響特徴に及ぼす影響
人同士の何気ない日常会話を聞き取り、言葉の明瞭度合やイントネーションの時間変化度合から、その人の加齢に伴う衰え度合を推定する技術を構築しています。一緒に住む家族が、日常生活の状況から「そろそろおじいちゃん車の運転難しいかもね」と感じ取る程度に、衰えの兆しを感じ取るしくみができたら、高齢ドライバーに免許返納をやんわり促すこともできるかもしれません。

癒される音楽ってどんな特徴のある音楽なのか、を解き明かす

残響音とリラックス感を与える音楽との関係
聴いているとリラックスできる音楽ってどんな音楽?と聞かれたらどう答えますか?そんなの人によって違うでしょ、と考えがちですが、多くの人がリラックスできる音楽に共通した特徴があることがわかってきました。各楽曲が提供する残響音の聴こえ量が、リラックスの一つの指標であると提案しています。この指標を応用して今度は、かわいいなあ、という印象を感じる楽曲の指標化に取り組んでいます。

この音声認識結果は信用できるのか、認識結果の「でたらめ度合」を評価する

入力音声に与えた僅かな歪から不明瞭な発話を推定
昨今の音声認識技術はレベルが高く、読み上げ音声を見事に文字に変換しますが、日常会話音声になると時々誤った音声認識結果を出力します。この結果を信用して利用することは問題です。そこで、僅かな人工的ひずみを与えた音声波形の音声認識結果から、認識誤りの主な原因となる「発話の不明瞭さ」を推定する技術を開発しています。「発話の不明瞭さ」を推定できれば、認識結果を信用していいかどうか、その「でたらめ度合」を見極めることができるのです。