ポケットサイズの研究アシスタントを作ってみた – ESP32-S3 + n8n AI で実現!

論文を読み上げてくれるポケットAIを作ってみた 📚🔊

週末に作ってみたちょっとしたプロジェクト。でも、予想以上に便利なものが完成しました。

ポケットに入るサイズの研究アシスタント。論文を検索し、要約を生成し、Notionにメモを送信して、さらには読み上げまでしてくれる。しかもスマホもパソコンも不要です。

ESP32-S3マイコンn8nで構築したAIエージェントを使って、低コストで実現しました。

🎒 想像してみてください:

ポケットの中の小さなデバイスがこんなことをしてくれます:

  • 📡 自動でWi-Fi接続
  • 🔍 論文の検索と取得
  • ✍️ AIによる要約生成
  • 📤 Notionに自動でメモを送信
  • 🔊 要約を音声で読み上げ(オフライン再生可能)

Wi-FiさえあればOK。一度接続すれば完全に自律的に動作します。スマホもパソコンもいりません。電源を入れてすぐ使えます。


⚙️ 中身はどうなってる?

このデバイスの仕組みとテクノロジーを簡単に紹介します:

  • 音声録音とオーディオ処理
    Recorderモジュールで音声を録音し、カスタム関数を使ってWAV形式に変換。OpenAI Whisper APIへ送信して音声認識(文字起こし)を行います。

  • 自然言語理解(NLP)
    認識されたテキストは、n8nのWebhookで動作するカスタムエージェントに送信。Unicode対応で、日本語や中国語など多言語でも正確に応答できます。

  • 液晶ディスプレイ表示
    ユーザーの音声入力とAIの返答は、カラフルにページ分けされてLCDに表示されます。読みやすく、視認性も抜群です。

  • タッチ操作
    録音開始/停止は、画面に軽くタッチするだけ。物理ボタン不要、スマートな操作体験です。

  • 音声読み上げ機能
    AIの返答は音声としてスピーカーで再生されるので、歩きながらでも「聴く読書」が可能です。

デバイス単体で完結。スマホもパソコンも不要。
セットアップはたったの10分、ガジェット好きにはたまらない体験です!


📸 実際のビルドはこちら:

Youtube動画


今回は1日で構築しましたが、まだまだ改良予定です。今後は以下も順次シェア予定:

  • 🧠 MicroPythonの全コード
  • 🔗 n8nでの自動化ワークフロー
  • 🔊 音声再生機能の強化(DAC:ES8311搭載)

オートメーション、エッジAI、組み込み開発に興味のある方は、ぜひフォローしてご覧ください!


好奇心をくすぐるハッシュタグ: #マイコン #ESP32S3 #AI音声アシスタント #Notion連携 #MicroPython #WhisperAPI #n8n #エッジAI