
子供の頃からロボットに憧れを抱いていたあるMakerが、バイラル動画に触発されて1年をかけて制作したAIロボット「Tommy B 003」が完成した。このプロジェクトでは、Raspberry Pi 4BとChatGPT realtime APIを組み合わせ、レトロなブラウン管テレビとアニマトロニクスを搭載したポータブルなAIアシスタントを実現している。作者は「ロボットとのやり取りはもっと記憶に残るものであるべきだ」として、単なる音声アシスタントを超えた「生きているような」ロボットの制作に挑戦した。
このプロジェクトは、YouTuberのThomas Burnsが制作した「Alexatron」に触発されて始まった。作者は動画の中で「Thomas Burnsの動画は素晴らしく、人格のあるロボットへの欲求を再燃させた」と語っている。Alexatronと同様に、古い技術と新しい技術を組み合わせることで、独特のキャラクター性を持つロボットの実現を目指した。
レトロCRTとRaspberry Piの融合設計
Tommy B 003の心臓部となっているのは、Panasonic TR00003Cという3インチのポータブルCRTテレビだ。このレトロなデバイスを改造して音声波形ビジュアライザーとして機能させ、ロボットの「口」として使用している。水平偏向コイルをはんだ除去し、12V音声アンプに接続することで、音声に合わせて画面上に波形を表示する仕組みを構築した。
目の部分には、Will Cogleyが設計したアニマトロニクス機構を採用。3Dプリント、塗装、キャストで製作されたリアルな目玉と、サーボモーターによる動作機構を組み合わせている。Person Sensorによる顔認識機能により、ユーザーとアイコンタクトを取ることも可能だ。
Raspberry Pi 4BとChatGPT APIで実現したAI対話
技術的な核となるのがRaspberry Pi 4Bで、ChatGPT realtime APIとの接続によりリアルタイムでの対話を実現している。音声入力にはUSBマイク、音声出力には元のPanasonicスピーカーを再利用している。作者は実際の対話テストで「あなたの好きなロボットは何ですか?」という質問に対し、Tommy B 003が「あなたが私のお気に入りのロボットです」と応答する様子を披露している。
ポータブル性を重視した設計も特徴的だ。12Vドリル用バッテリーで駆動し、各システムに必要な電圧を供給するため複数の昇降圧コンバーターを搭載している。レトロな雰囲気を演出するため、1950年代のオシロスコープや顕微鏡をイメージしたベージュと黒の配色を採用し、オリジナルのPanasonicブランディングも一部保持している。
専用のキャリングケースも制作され、キャンバスと黒いビニールレザーで内装された木製ボックスに収納できる設計となっている。ロボット本体は底部にネジで固定され、小さなプラスチックキャップで隠される工夫も施されている。
前面の制御パネルには、メイン電源スイッチ、ボリュームノブ、マイクロフォンを配置。背面には各主要システムを個別にオン/オフできる切断スイッチを設置している。CRT波形アンプの調整用小穴や、Person Sensorカメラの配置なども考慮された実用的な設計だ。
ロボットの名前「Tommy B 003」は、元となったThomas Burns(Tommy B)と、使用したPanasonic TR003Cにちなんで命名された。作者は「プログラマーとしてはベストではないが、Tommyは許容できるレベルで機能している」と評価しており、今後はローカルで動作するLLMの実装により、インターネット接続なしでも動作する改良を検討している。
関連情報
I used a raspberry pi to build my childhood ideal of what a robot should be!(reddit)