Categories: 工作・開発

Raspberry Piで多言語対応の音声AIアシスタントを自作、話しかけるだけで天気やレストラン情報を回答

Raspberry Pi財団は2025年9月30日、同社の公式ブログで小型コンピューター「Raspberry Pi」を使った音声アシスタントの構築方法を公開した。音声AI技術を提供するElevenLabsの会話型AIモデルを活用し、完全にハンズフリーで動作する多言語対応のアシスタントを実現している。開発者のThor Schaeff氏が詳細な実装方法を紹介している。

ElevenLabsは、自然な音声合成と会話型AIを提供する企業で、テキスト読み上げや音声クローン技術で知られている。同社の会話型AIプラットフォームを使うことで、自然な対話が可能な音声アシスタントを構築できる。

初心者でも揃えやすい機材と設定方法

必要な機材は3つだけ。まずRaspberry Pi本体(処理速度を考慮するとRaspberry Pi 5がお薦め)、次にマイクとスピーカー(市販のBluetoothスピーカーでマイク内蔵タイプなら1台で済む)、そしてインターネット接続環境があれば始められる。

ソフトウェア面では、Raspberry Piに標準的なプログラミング言語であるPython(バージョン3.9以上)をインストールし、ElevenLabsの無料アカウントを作成してAPIキーを取得する。その後、GitHubで公開されているプログラムコードをダウンロードして、指示に従って必要なプログラムをインストールすれば準備完了となる。

このシステムの特徴は、「Hey Eleven」といった呼びかけの言葉(ホットワード)を自由に設定できること。マイクが常に待機状態で音声を監視し、設定した言葉を検出すると会話モードが起動する仕組みだ。会話が終わると自動的に待機状態に戻り、次の呼びかけを待つ。

実際のデモンストレーションでは、Schaeff氏が「ニューヨークの現在の天気は?」と尋ねると、システムが摂氏27~28度で穏やかな風が吹いていると回答。続けて「ニューヨークのピザレストランのお薦めは?」と質問すると、Joe’s PizzaやLombardi’s、Prince Street Pizzaといった人気店を紹介している。

多言語対応も大きな特徴で、英語のほかドイツ語や中国語(北京語)での会話も可能。ElevenLabsのダッシュボードで言語を追加するだけで、複数言語での応答ができるようになる。天気情報はOpenMeteor APIという無料の気象データサービスと連携し、リアルタイムの情報を取得している。

Raspberry Piのボードメンバーであるchris Mairs氏は、視覚障害者向けのブログ「The Open Eyed Man」を運営しており、会話型音声エージェントが障害者にとって変革的な技術になる可能性があると述べている。同氏は自身の音声をクローンし、ブログの音声ナレーションに活用している。

セットアップの詳細な手順とソースコードはGitHubで公開されており、プログラミング経験がある人なら誰でも自分好みの音声アシスタントにカスタマイズできる。

関連情報

How to build a multilingual conversational AI voice assistant – Raspberry Pi

関連商品(広告)

Raspberry Pi
¥12,700 (2025/10/01 09:32時点 | Amazon調べ)
FabScene編集部

FabScene編集部