画像処理分野の世界最大の国際学会ICIP 2024にて Best Paper Awardを受賞
~ICIP 2024では受賞論文を含む7件の論文が採録~
2024年11月20日
株式会社KDDI総合研究所
KDDI総合研究所は、画像処理分野で著名な国際会議「ICIP 2024(注1)」(2024年10月27日~10月30日)にてBest Paper Awardを受賞しました。Best Paper AwardはICIP 2024に採録された596の論文のうち、最も高く評価された論文1件に対して与えられるものです。さらにICIP 2024では、受賞論文と共に6件の論文が採録されました。
【受賞論文の概要】
Full-Reference Point Cloud Quality Assessment Using Spectral Graph Wavelets
三次元(以下、3D)点群データ(注2)は、建設現場での施工管理や自動運転などのアプリケーションにおける3Dデータの表現形式として幅広く用いられており、国際標準方式PCC(Point Cloud Compression)などの効率的な圧縮技術の開発が進められています。これらの圧縮技術の実用化のためには、圧縮に伴う品質の劣化を客観的に評価する手法の確立が必須となります。
KDDI総合研究所は共同研究先の南カリフォルニア大学とともに、グラフ信号処理技術(注3)をベースに3D点群データをグラフとして構造化し、グラフ上の広域的な劣化から局所的な劣化までを網羅的に検知できる技術を提案しました。具体的には、グラフ上の信号(ここでは点の座標値や色情報)を、広域的に滑らかに変動する信号成分と、局所的に激しく変動する信号成分に分解できる信号変換技術であるグラフウェーブレット変換を活用し、得られた成分を劣化前と劣化後のそれぞれの3D点群データについて比較することで、点群の品質劣化度合いを評価します。この結果、ICIP 2023で開催された点群品質評価のコンペティション(注4)で優勝した当社従来手法の精度を上回る高精度な点群品質評価を実現しました。
【原著論文情報】
Ryosuke Watanabe, Keisuke Nonaka, Eduardo Pavez, Tatsuya Kobayashi and Antonio Ortega, "Full-Reference Point Cloud Quality Assessment Using Spectral Graph Wavelets," 2024 IEEE International Conference on Image Processing (ICIP), Abu Dhabi, United Arab Emirates, 2024, pp. 3313-3319,
doi: 10.1109/ICIP51287.2024.10647796.
受賞論文は、総務省SCOPE(国際標準獲得型)JPJ000595の委託を受けて実施した研究開発の成果です。
(注1)国際学術会議IEEE ICIP(IEEE International Conference on Image Processing)は、画像処理領域のフラグシップと位置づけられる国際学術会議。
(注2)3D物体を点の位置と色の集合で表現するデータ形式。
(注3)信号値間の関係を、グラフを用いて定義した上で、グラフの構造を利用して解析処理を行う信号処理技術。
(注4)2023年10月6日トピックス
画像処理分野の世界最大の国際学会ICIP 2023のコンペティション
「Point Cloud Visual Quality Assessment Grand Challenge」で優勝
(別紙)
【採録論文の概要】
1.Minimization of Submesh Boundary Errors In Dynamic Mesh Coding
時間の経過とともに構造が変化する人物や動物のような3Dメッシュモデルは、メタバースなどでの応用が期待されています。このような3Dメッシュデータの圧縮をリアルタイムで処理するためには、メッシュを分割して並列処理が求められます。本論文ではメッシュ分割の際に発生する境界部分の間隙を補正するため、分割処理手順の洗練化と境界誤差の最小化により、主観画質を大幅に改善できる手法を提案しました。
【原著論文情報】
Koki Kishimoto, Kei Kawamura and Haruhisa Kato, "Minimization of Submesh Boundary Errors In Dynamic Mesh Coding," 2024 IEEE International Conference on Image Processing (ICIP), Abu Dhabi, United Arab Emirates, 2024, pp. 3368-3374,
doi: 10.1109/ICIP51287.2024.10647339.
2.Temporal Scalable Coding For Dynamic Meshes
時間の経過とともに構造が変化する人物や動物のような3Dメッシュモデルは、メタバースなどでの応用が期待されています。このような3Dメッシュデータを多様な配信環境に柔軟かつ効率的に対応させるためには、3Dメッシュデータに階層的なデータ構造が求められます。本論文では、3Dメッシュモデルの構造に着目し、3Dメッシュモデルの時間的な依存関係を階層的に組みなおすことで、世界で初めて3Dメッシュモデルに時間的スケーラビリティを実現する手法を提案しました。
【原著論文情報】
Jianfeng Xu, Haruhisa Kato and Kei Kawamura, "Temporal Scalable Coding For Dynamic Meshes," 2024 IEEE International Conference on Image Processing (ICIP), Abu Dhabi, United Arab Emirates, 2024, pp. 3285-3291,
doi: 10.1109/ICIP51287.2024.10647600.
3.Partial Inter-Frame Coding for Dynamic Meshes
時間の経過とともに構造が変化する人物や動物のような3Dメッシュモデルは、メタバースなどでの応用が期待されています。このような3Dメッシュデータを効率的に圧縮するには、3Dメッシュデータの時間的な冗長性を適切に削減することが求められます。本論文では、3Dメッシュモデルの局所的な領域ごとに時間変化を評価し、部分的に時間的相関を利用するか否かを適応的に切り替えることで、3Dメッシュモデルの圧縮効率を大幅に改善する手法を提案しました。
【原著論文情報】
Xudong Jin, Jianfeng Xu and Kei Kawamura, "Partial Inter-Frame Coding for Dynamic Meshes," 2024 IEEE International Conference on Image Processing (ICIP), Abu Dhabi, United Arab Emirates, 2024, pp. 3457-3463,
doi: 10.1109/ICIP51287.2024.10647545.
4.Quantization After Inter Prediction in Displacement Coding of Dynamic Meshes
時間の経過とともに構造が変化する人物や動物のような3Dメッシュモデルは、メタバースなどでの応用が期待されています。このような3Dメッシュデータを効率的に圧縮するには、3Dメッシュデータの圧縮に伴う誤差を適切に抑制することが求められます。本論文では、3Dメッシュモデルの圧縮による誤差が発生する箇所を複数特定し、誤差が発生する箇所を1か所に統合することで、3Dメッシュモデルの圧縮に伴う誤差を大幅に削減する手法を提案しました。
【原著論文情報】
Hitoshi Nishimura, Haruhisa Kato and Kei Kawamura, "Quantization After Inter Prediction in Displacement Coding of Dynamic Meshes," 2024 IEEE International Conference on Image Processing (ICIP), Abu Dhabi, United Arab Emirates, 2024, pp. 3361-3367,
doi: 10.1109/ICIP51287.2024.10648035.
5.Extended Multiple Cross-Component Linear Models With Adaptive Thresholding and Overlapped Averaging Beyond VVC
映像配信サービスの普及やリモートワークにおけるTV会議など映像の伝送量が増大しつつある中、映像の圧縮の重要性がますます高まっています。映像を効率的に圧縮するには色の冗長性を適切に削減することが求められます。本論文では、映像を構成する色の相関関係を利用し複数の異なる予測方式を適用することで、映像の圧縮効率を改善する手法を提案しました。
【原著論文情報】
Haruhisa Kato, Yoshitaka Kidani and Kei Kawamura, "Extended Multiple Cross-Component Linear Models With Adaptive Thresholding and Overlapped Averaging Beyond VVC," 2024 IEEE International Conference on Image Processing (ICIP), Abu Dhabi, United Arab Emirates, 2024, pp. 1843-1849,
doi: 10.1109/ICIP51287.2024.10647587.
6.Bi-Predictive Intra Block Copy for Enhanced Video Coding Beyond VVC
映像配信サービスの普及やリモートワークにおけるTV会議など映像の伝送量が増大しつつある中、映像の圧縮の重要性がますます高まっています。映像を効率的に圧縮するには空間的な冗長性を適切に削減することが求められます。本論文では、画面内から複数の類似領域を探索しブレンドすることで空間的な冗長性を削減し、映像の圧縮効率を大幅に改善する手法を提案しました。
【原著論文情報】
Yoshitaka Kidani, Haruhisa Kato and Kei Kawamura, "Bi-Predictive Intra Block Copy for Enhanced Video Coding Beyond VVC," 2024 IEEE International Conference on Image Processing (ICIP), Abu Dhabi, United Arab Emirates, 2024, pp. 1994-2000,
doi: 10.1109/ICIP51287.2024.10647721.
論文1~論文4は、総務省SCOPE(国際標準獲得型)JPJ000595の委託を受けて実施した研究開発の成果です。
論文5および論文6は、国立研究開発法人情報通信研究機構(NICT)の委託研究(JPJ012368C06801)にて実施した研究開発の成果です。
※ニュースリリースに記載された情報は、発表日現在のものです。 商品・サービスの料金、サービス内容・仕様、お問い合わせ先などの情報は予告なしに変更されることがありますので、あらかじめご了承ください。