KoeMojiAuto

音声・動画ファイルから自動で文字起こしを行うクロスプラットフォームCLIツール

✨ 主な特徴

🚀

高速処理

INT8量子化でCPUでも高速

🎯

高精度

Whisperによる高精度認識

🔄

自動処理

フォルダ監視で自動実行

🌐

クロスプラットフォーム

Windows/Mac/Linux対応

🇯🇵

日本語対応

日本語音声に最適化

⚙️

柔軟な設定

config.jsonで簡単カスタマイズ

ダウンロード 使い方 FAQ GitHub 技術詳細

🚀 クイックスタート

Windows

  1. Python 3.9以上をインストール(必ず「Add Python to PATH」にチェック
  2. install.batをダブルクリックする
  3. create_shortcut.batでショートカット作成して好きな場所に移動する
  4. 音声ファイルをinput/フォルダに入れる
  5. ショートカットから起動して「1」を押してEnter

文字起こしが実行されます。初回はWhisperAIのダウンロードなどがあります。しばらくお待ちください。何か上手く動かなければ再起動してください。ほとんどの問題は解決します。

Mac

  1. ターミナルでpython3 --versionを確認(3.9以上が必要)
  2. プロジェクトフォルダでpython3 install.pyを実行
  3. 短縮コマンドの設定(オプション):
    • ./setup_aliases.shを実行
    • source ~/.zshrcを実行(設定を反映)
    • 以降はkmだけで起動可能に!
  4. 音声ファイルをinput/フォルダに入れる
  5. kmで起動(またはpython3 run.py)して「1」を押す