メイン開発言語。非同期処理、ファイル操作、システム統合に使用
OpenAI Whisperの高速実装。音声認識のコアエンジン(INT8量子化対応)
システムリソース監視。CPU使用率制御とプロセス管理
並行処理制御。ファイル監視と処理の分離
scan_and_queue_files()
• 定期的な入力フォルダスキャン
• 対応形式フィルタリング
• 重複処理防止
processing_queue
• FIFO方式のファイル処理
• メタデータ付きキューイング
• 同時処理数制御
transcribe_audio()
• Whisperモデル管理
• 日本語音声認識
• セグメント単位処理
wait_for_resources()
• CPU使用率監視
• メモリ効率化
• グレースフルシャットダウン
cleanup_on_exit()
• 段階的例外処理
• ログベース状態追跡
• 自動復旧機能
display_cli()
• シンプルメニュー
• リアルタイムログ表示
• 対話的操作
int8: CPU処理に最適化、メモリ効率的
fp16: より高精度、GPU使用時推奨
auto: システムに応じて最適な設定を自動選択
large: 最高精度(推奨)
medium/small: 高速処理優先時
ファイル監視(Producer)と処理実行(Consumer)の分離
ファイル処理状態の管理(待機→処理中→完了→アーカイブ)
設定ファイルによる動作カスタマイズ(compute_type、モデルサイズ等)
Whisperモデルの単一インスタンス管理
• バッチファイル(.bat)による簡易セットアップ
• ショートカット作成スクリプト
• Windows 10/11完全対応
• Homebrewを使用したPython管理
• zshエイリアス設定スクリプト
• Apple Siliconネイティブ対応
• 各ディストリビューション対応
• シェルスクリプトによる柔軟な設定
• Dockerコンテナ化対応(予定)