unoh.github.com

FFmpegで変換した3GPP動画をNTTドコモiモーションのストリーミング再生に対応させる (for Linux)

Thu Nov 01 02:19:06 -0700 2007

isogawaです。

さまざまな形式の動画を携帯電話向けに変換して配信するサービスでは、変換処理をFFmpegで行っている例が多いと思われます。しかしFFmpegが出力する3GPPファイルは、NTTドコモiモーションの、ストリーミング(プログレッシブダウンロード)方式での再生はできません。QuickTime Proや携帯動画変換君で作成した動画はストリーミング再生も可能ですが、変換処理をLinux上で行っている場合には、これらを利用するわけにもいきません(できないことはないですが)。ではどうしたらいいでしょう?という小ネタ。

なにが問題なのか

+--ftyp
+--free
+--mdat
+--moov
  +--mvhd
  +--trak
  | +--tkhd
  | +--mdia
  +--trak
  | +--tkhd
  | +--mdia
  +--udta

3GPPのファイルフォーマットについては、以前の MP4/3GPP/3GPP2ファイルフォーマットの基礎知識をご覧いただくとして、FFmpegが出力する3GPPファイルのAtom/ボックス構造はこんな感じになってます(例によって入れ子は端折ってます)。

このうち、mdatボックスにはメディアデータ(動画や音声の実際のデータ)、moovボックスにはメタデータが格納されているわけですが、この構造だとメディアデータの読み込み完了後にメタデータを読み込むことになるわけで。このままでは、データを逐次読み込んで再生するプログレッシブダウンロードは無理なので、mdatとmoovの順番を入れ替えてやる必要があります。

もうひとつ。ftypボックスにはそのファイルの互換性を示す「ブランド」値が記録されてます。iモード端末は通常のダウンロード再生ではここの値を気にしないようですが、一方ストリーミング再生の場合は、ここにiモーション対応のファイルであることを示す値(mmp4)がないとダメみたいです。

てなことで、FFmpegで変換した3GPP動画をNTTドコモiモーションのストリーミング再生に対応させるには、以下のふたつの処理を行う必要があるようです。

  1. mdatをmoovの後に配置する。
  2. ftypに「mmp4」を追加する。

ではどうするか

FFmpegのGUIフロントエンドである携帯動画変換君で作成した動画がどうして携帯電話できちんと再生できるかというと、携帯動画変換君はFFmpegで(コーデックを)変換した出力を、独自開発のツールで整形しているためです。変換処理をWindows上で行っている場合は、これらのツールが利用できますが、Linuxではそういうわけにもいきません(できないことはないですが)。

ではLinuxではどうしようかということで。バイナリをゴリゴリ削ってファイルフォーマットを書き換えるプログラムを書き起こすのも一興ですが、上に挙げた処理については、オープンソースのマルチメディアフレームワークGPAC付属のコマンドラインツール、MP4Boxを使うと簡単に行えます。はい、ようやく本題です(笑)。

FFmpegの出力をMP4Boxで整形する

以下のようなコマンドで、FFmpegで「input.avi」ファイルからMPEG4/AMRな「output.3gp」ファイルを作成したとして。

ffmpeg -i input.avi -vcodec mpeg4 -b 64k -s qcif -r 15 -acodec libamr_nb -ab 12200 -ar 8000 -ac 1 -flags bitexact output.3gp

MP4Boxで「output.3gp」ファイルを読み込み「output_mod.3gp」ファイルを作成すると。

mp4box -add output.3gp -brand mmp4:1 -new output_mod.3gp
+--ftyp
+--moov
| +--mvhd
| +--trak
| | +--tkhd
| | +--mdia
| +--trak
|   +--tkhd
|   +--mdia
+--mdat
+--free

「output_mod.3gp」ファイルのAtom/ボックス構造を確認するとこんな感じで。ご覧のようにmdatがmoovの後に配置し直されています。

そしてMP4Boxの「-brand」パラメータは、ftypのメジャーブランドの値をパラメータの引数で指定した文字列に変更しています(この例では「mmp4」)。

こうして出来上がった「output_mod.3gp」ファイルは、iモード端末でストリーミング方式での再生ができるようになってると思います。

MP4Boxの使い途あれこれ

MP4Boxは3GPPやMP4ファイルを操作するさまざまな機能が用意されており、携帯電話向けの動画を扱う際にはなにかと便利です。

ファイルを指定サイズで分割したり

例えば携帯電話向けの動画は、端末が受信可能なデータサイズの制限に応じてファイルを分割する必要が生じる場合がありますが、以下のようなコマンドで、指定のデータサイズ(以下の例では300キロバイト)以内で、動画を複数のファイルに分割してくれます。

mp4box -splits 300 large-file.3gp

ちなみにFFmpegでもファイルを分割できますが、指定のデータサイズ以内にきちんと収まらなかったり、あれこれバッドなノウハウを凝らす必要があったりするので、単純な分割であれば、MP4Boxを利用したほうがお手軽かと。

フラグメントを結合したり

あるいはFFmpegで、auの携帯電話で作成した3GPP2ファイルを変換すると、(本来の再生時間はもっと長い筈なのに)最初の15秒しか変換されない場合があったりしますが、この現象もMP4Boxを使って解消できます。

この現象は3GPP2の特徴のひとつであるムービーフラグメントに因るものですが(ムービーフラグメントについては MP4/3GPP/3GPP2ファイルフォーマットの基礎知識の、moofボックスの説明をご覧ください)。フラグメントなファイルをMP4Boxで-addとかした出力は(明示的に指定しない限り)フラグメントが結合されるので、FFmpegでもきちんと変換できるようになります。

MP4Boxについて

MP4Boxは、GNU LGPLでライセンスされるオープンソースのマルチメディアフレームワークGPACの付属ツールです。MP4Boxはコマンドラインツールですが、WindowsではYAMBなどのGUIフロントエンドも利用できます。

MP4Boxのドキュメントは以下にあります。

謝辞

この記事の元ネタ作成はharukiさんに協力いただきました。Thanksでーす。