📖 使い方ガイド
KoeMojiAutoの基本的な使い方を説明します
🚀 基本的な使い方(Windows)
1
音声ファイルを配置
input/
フォルダに音声・動画ファイルを入れます。
対応形式: MP3, WAV, M4A, FLAC, OGG, AAC, MP4, MOV, AVI
2
プログラムを起動
デスクトップのショートカットをダブルクリック、またはrun.bat
を実行
3
処理を開始
メニューで「1」を入力してEnterキーを押します
4
結果を確認
処理が完了するとoutput/
フォルダにテキストファイルが作成されます
元ファイルはarchive/
フォルダに移動されます
🍎 基本的な使い方(macOS)
1
音声ファイルを配置
ターミナルでkmi
コマンドを実行するか、input/
フォルダに直接ファイルを配置
対応形式: MP3, WAV, M4A, FLAC, OGG, AAC, MP4, MOV, AVI
2
プログラムを起動
ターミナルでkm
コマンド、またはpython3 run.py
を実行
3
処理を開始
メニューで「1」を入力してEnterキーを押します
4
結果を確認
kmo
コマンドでFinderが開くか、output/
フォルダを直接確認
元ファイルはarchive/
フォルダに移動されます
💡 Mac便利コマンド
km
- KoeMojiを起動kmi
- 入力フォルダを開くkmo
- 出力フォルダを開くkml
- ログをリアルタイム表示
🐧 基本的な使い方(Linux)
1
音声ファイルを配置
input/
フォルダに音声・動画ファイルを配置
対応形式: MP3, WAV, M4A, FLAC, OGG, AAC, MP4, MOV, AVI
2
プログラムを起動
ターミナルでpython3 run.py
を実行
3
処理を開始
メニューで「1」を入力してEnterキーを押します
4
結果を確認
output/
フォルダにテキストファイルが作成されます
元ファイルはarchive/
フォルダに移動されます
⚙️ 設定のカスタマイズ
AIモデルの変更
config.json
のwhisper_model
を変更することで、処理速度と精度を調整できます:
{
"whisper_model": "large", // large(高精度), medium(バランス), small(高速)
"language": "ja", // 言語設定
"scan_interval_minutes": 30, // フォルダ監視間隔
"max_cpu_percent": 95 // CPU使用率上限
}
処理時間の目安
- small: 1時間の音声 → 約20-30分
- medium: 1時間の音声 → 約40-60分
- large: 1時間の音声 → 約60-90分
⚠️ 重要な注意事項
- 初回起動時は、AIモデルのダウンロードに10-30分かかります
- 処理中にプログラムを終了すると、その時点で処理が停止します
- 大きなファイルを処理する場合は、十分な空きディスク容量を確保してください