ポケットサイズの研究アシスタントを作ってみた – ESP32-S3 + n8n AI で実現!
論文を読み上げてくれるポケットAIを作ってみた 📚🔊
週末に作ってみたちょっとしたプロジェクト。でも、予想以上に便利なものが完成しました。
ポケットに入るサイズの研究アシスタント。論文を検索し、要約を生成し、Notionにメモを送信して、さらには読み上げまでしてくれる。しかもスマホもパソコンも不要です。
ESP32-S3マイコンとn8nで構築したAIエージェントを使って、低コストで実現しました。
🎒 想像してみてください:
ポケットの中の小さなデバイスがこんなことをしてくれます:
- 📡 自動でWi-Fi接続
- 🔍 論文の検索と取得
- ✍️ AIによる要約生成
- 📤 Notionに自動でメモを送信
- 🔊 要約を音声で読み上げ(オフライン再生可能)
Wi-FiさえあればOK。一度接続すれば完全に自律的に動作します。スマホもパソコンもいりません。電源を入れてすぐ使えます。
⚙️ 中身はどうなってる?
このデバイスの仕組みとテクノロジーを簡単に紹介します:
-
音声録音とオーディオ処理
Recorder
モジュールで音声を録音し、カスタム関数を使ってWAV形式に変換。OpenAI Whisper APIへ送信して音声認識(文字起こし)を行います。 -
自然言語理解(NLP)
認識されたテキストは、n8nのWebhookで動作するカスタムエージェントに送信。Unicode対応で、日本語や中国語など多言語でも正確に応答できます。 -
液晶ディスプレイ表示
ユーザーの音声入力とAIの返答は、カラフルにページ分けされてLCDに表示されます。読みやすく、視認性も抜群です。 -
タッチ操作
録音開始/停止は、画面に軽くタッチするだけ。物理ボタン不要、スマートな操作体験です。 -
音声読み上げ機能
AIの返答は音声としてスピーカーで再生されるので、歩きながらでも「聴く読書」が可能です。
デバイス単体で完結。スマホもパソコンも不要。
セットアップはたったの10分、ガジェット好きにはたまらない体験です!
📸 実際のビルドはこちら:
Youtube動画
今回は1日で構築しましたが、まだまだ改良予定です。今後は以下も順次シェア予定:
- 🧠 MicroPythonの全コード
- 🔗 n8nでの自動化ワークフロー
- 🔊 音声再生機能の強化(DAC:ES8311搭載)
オートメーション、エッジAI、組み込み開発に興味のある方は、ぜひフォローしてご覧ください!
好奇心をくすぐるハッシュタグ: #マイコン #ESP32S3 #AI音声アシスタント #Notion連携 #MicroPython #WhisperAPI #n8n #エッジAI