AIソリューション一覧に戻る

Nexa SR-NPU

低解像度画像をAIで2~4倍に高精細化するFPGA用チップ。 200MHzでHD→フルHD(30fps)に高速変換し、軽量・省電力で組み込み機器向けに最適。

Nexa SR-NPU

デモ動画

System Overview 1
System Overview 2

こんな課題、ありませんか?

多くのカメラシステム、センサー機器、エッジデバイス、または組み込み機器において、入力画像はセンサーの制限、伝送帯域、消費電力、またはハードウェアコストの制約により、低解像度であることが一般的です。これにより、以下のような現実的な問題が発生します:

入力品質の低さ:

センサーやカメラから取得される画像は低解像度(例: 960x540)であり、標準的なディスプレイに拡大表示するとぼやけたり、詳細が不足したりします。

従来ソフトウェアの限界:

OpenCVなどの一般的なソフトウェアによる画像拡大(補間)方法では、画像品質が低く、ブロックノイズやぼやけが発生しやすいです。

性能・遅延のボトルネック:

ニューラルネットワーク(AI)モデルを使用して解像度を向上させる(Super Resolution)処理を、通常のCPUやGPUで実行すると、リソース消費が大きく、電力消費が高く、遅延が発生します。

これにより、エッジデバイスや組み込み機器でのリアルタイム高解像度画像処理が困難になります。

Nexa SR-NPU解決します

上記の問題を解決するため、当社はFPGAを基盤とした専用ハードウェアアクセラレータ「SR-NPU(Super Resolution Neural Processing Unit)」チップを開発しました。

このソリューションは、Deep Learningモデルを使用して画像を2倍〜4倍にアップスケーリングし、OpenCVを上回る優れた画像品質を実現すると同時に、リアルタイム処理を可能にします。

システムは以下の3層で包括的に設計されています:

ハードウェア層(SR-NPU Core):

FPGAに直接組み込まれたニューラルネットワーク処理モジュールです。

このブロックは並列演算コア(Core-M、Core-S)、最適化された内部メモリバッファ(Param buffer、Feature Maps)を備え、マトリックス演算を極めて高速に処理します。

ドライバ・OS層(Driver & OS):

FPGAのCPU上で動作する組み込みOSとDMA(Direct Memory Access)コントローラを組み合わせ、RAMとNPU間の画像データをスムーズに転送します。FPGAボードとホストPC間の通信を管理します。

アプリケーション層(API):

ホストPC上でSuper Resolution APIを提供し、カメラからのビデオストリームをハードウェアシステムに簡単に統合できます。

ソリューションの優位点:

超軽量かつ極めて低い遅延:ハードウェアロジック上で直接処理するためです。
優れた性能:960x540の画像をFull HD(1920x1080)にアップスケーリングして30 fpsを実現でき、クロック周波数はわずか200MHzです。
拡張性(Scalability):データ転送経路を設計し、クロックを1.6GHzまで上げれば、このアーキテクチャで4K 60 fpsの画像生成も十分可能です。

使用テクノロジー

Hardware:

FPGAデバイス
カスタムNPUアーキテクチャ(Processing Elements、MACs、DMA、L1/L2 Buffers...)。

Interfaces:

On-chip - Advanced eXtensible Interface (AXI)

Host-to-Device:

PCI-E(大帯域幅用)
UART(基本制御用)。

Algorithm & AI

Deep Neural Networks (DNN)
Convolutional Neural Networks (CNN)。

Software/Embedded:

Embedded OS
C/C++
Python
OpenCVライブラリ

Hardware Description:

Verilog
VHDL

Nexa SR-NPU体験する

デモのリクエストやご質問など、お気軽にお問い合わせください。

デモをリクエスト