幅広く利用される動画圧縮コーデック「H.264/MPEG-4 AVC」はどうやって巨大なサイズのムービーを劇的に圧縮するのか?

  • 📰 gigazine
  • ⏱ Reading Time:
  • 58 sec. here
  • 2 min. at publisher
  • 📊 Quality Score:
  • News: 27%
  • Publisher: 51%

日本 見出し ニュース

日本 最新ニュース,日本 見出し

幅広く利用される動画圧縮コーデック「H.264/MPEG-4 AVC」はどうやって巨大なサイズのムービーを劇的に圧縮するのか?(2019)

で表現する「クロマサブサンプリング」という手法もあります。人間の目は、明るさの変化には敏感に反応しますが、色調の変化については鈍感なもの。クロマサブサンプリングは、人には認識が難しい色差情報をカットすることでデータの削減を可能にします。に変換する考え方が紹介されています。例えば、MacBook Proのスピーカーグリルのように色調や輝度の変化が激しい部分は、高周波成分を持っている「高周波領域」です。一方で、影でなだらかなグラデーションがついた机の上は低周波成分を持っている「低周波領域」です。

Bala氏によると、人は変化がゆったりで単調な低周波領域だと画質の劣化にすぐ気づくものですが、反対に変化の激しい高周波領域だと多少劣化したところで認知しにくいとのこと。そこで、高周波領域におけるデータセットの情報を少しずつ排除することで、人間に気づかれないレベルの劣化に抑えながら圧縮します。 上段が画像を周波数領域で表したもので、下段がその画像。右に進むに従って、高周波領域の情報を少しずつ切り捨てています。一番右の画像は一番左の元画像に比べてわずか2%のファイルサイズにまで圧縮されていますが、一目見ただけではその劣化はわからないレベル。ただし、情報エントロピーが変化するため、この圧縮方式は非可逆となります。と呼ばれる技術による圧縮も行います。例えば、固定カメラでテニスの試合を撮影したムービーの場合、ボールやプレイヤーは大きく動きますが、審判やネット、試合の観客が大きく動くことはありません。審判・ネット・観客を1枚の背景にして、ボールとプレイヤーだけを動かすムービーにすれば、データサイズは大幅に圧縮できるはずです。

まず、H.264/MPEG-4 AVCでは画像が16ピクセル×16ピクセルのブロックに分割され、1つの静止画像にエンコードしたものをIフレームと呼びます。そして、Iフレームの次に来るフレームを予測し、そのフレームと実際に来るフレームのズレのみを表示します。差分情報のみでフレームを表現できるため、動画のデータサイズを大きく削減できるというわけです。 そして、前後のフレーム内に写っているものの動きを検知し、その方向や速さを符号化してフレームのデータに収めることで、圧縮率をさらに高める「動き圧縮」もH.264/MPEG-4 AVCの重要な技術。H.264/MPEG-4 AVCでは動き補償の精度単位を定めることができ、最小で4ピクセル×4ピクセル単位で動きを予想することが可能です。このフレーム間予測と動き圧縮によって、Iフレームには冗長な情報が含まれますが、エントロピー符号化で損失することなくデータをさらに圧縮することができます。Bala氏によると、前出のわずか5秒間だけAppleの公式サイトのトップページをキャプチャした60fpsムービーの非圧縮動画は、1232×1154という解像度だったとのこと。非圧縮動画のファイルサイズを計算すると1232ピクセル×1154ピクセル×60fps×3バイト×5秒で約1280MBになりますが、H.264/MPEG-4 AVCでエンコードしたことでわずか0.01%にあたる175KBにまでサイズを抑えられたことになります。Bala氏は「H.

 

コメントありがとうございます。コメントは審査後に公開されます。
このニュースをすぐに読めるように要約しました。ニュースに興味がある場合は、ここで全文を読むことができます。 続きを読む:

 /  🏆 80. in JP

日本 最新ニュース, 日本 見出し

Similar News:他のニュース ソースから収集した、これに似たニュース記事を読むこともできます。