チップ売りからソリューションに切り替えたETA Compute AIプロセッサーの昨今

チップ売りからソリューションに切り替えたETA Compute AIプロセッサーの昨今

  • ASCII.jp
  • 更新日:2021/02/22

ArmにしてもCEVAにしても、売るのはAI/ML(機械学習)のアクセラレーターIPであり、これをメーカーが組み込んで製品化するという方向性であった。これに対してチップ売りを狙ったのがETA Computeである。

ETA Computeは2015年に創業されたメーカーで、現在もまだ株式公開はしていない。創業からしばらくはステルスモードで推移しており、情報をある程度公開し始めたのは2017年のことである。この時の同社がなにを狙っていたかというと、他社製品と比較して消費電力が10倍少ないMCU(Micro Controller Unit)であった。

2017年4月に出たプレスリリースによれば、ETA Computeは待機時の駆動電圧をサブスレッショルドの領域(0.25V)まで下げられる技術を利用することで、TSMCの90LP(90nm Low Power)プロセスを使いながら、極端に待機電力を落とすことに成功したとしている。

加えてMCUだけでなく周辺回路(A/Dコンバーター、リアルタイムクロック、DSP、AES対応の暗号化アクセラレーターなど)もやはり同様に低電圧に耐えられる(*1)構造を作ることに成功し、これらを集約して長大な待機時間に耐えられるMCUを開発した。

この当時、同社はまだAIは考えておらず、むしろIoTデバイスが2020年(去年だ!)までに240億個も増えるという前提のもとに、特に安価なセンサーノードなどを狙ったものだった。下の画像がその構図であるが、縦軸が消費電力、横軸が電池寿命(どちらも対数軸)である。

No image

斜線はCR2032(いわゆるボタン電池)1個で駆動できる期間で、1mW程度の機器なら1ヵ月、0.1mWを切るとなんとか1年、10μW台まで落とせば10年が狙えるの意味。EH Limitは太陽光パネルなどを使った場合の供給電力。これを下回れば、バッテリーなしでもなんとかなる

太陽電池などによる、いわゆる環境発電というのは、せいぜいが10μWのオーダー(もちろん極端に大きい太陽電池パネルをつけられればもっと出せるが、設置場所の制約が大きくなりすぎる)なので、通常のマイコン+センサーの駆動の役にはたたない。

逆に言えば、環境発電で動作する、あるいはCR2032などのボタン電池1個で10年動作するMCUを作れば、安価なセンサーノードなどに採用が期待できると考えたわけだこの当時、ETA ComputeはむしろIP売りを前提にビジネスをしていた。ウェブサイトのProductsページを見ると、まだチップを売ることは考えていなかった。

No image

2017年当時のProductsページ。ほとんどはTSMCの55LPないし90LPだが、一部180nmのものも混ざっている

この方針が一転するのは2018年のことである。同社はSNN(Spiking Neural Network)をベースにした第3世代のニューラルネットワーク向けのシステムの開発という名目で、複数のベンチャーから800万ドルのシリーズAの投資を受けている。

もともとCNNは(連載561回でも書いたが)必ずも生化学、つまり脳内の神経細胞の振る舞いのシミュレーションとは無関係な、勾配法という計算科学でよく利用されている手法を使ってもうまくシミュレーションできるというところから始まっており、畳み込み(Convolution)はその一部である。

対してSNNは神経細胞の振る舞いにより近づけたモデルを利用することで精度や性能を改善しよう、というモデルである。2018年3月には、早くもこれに向けたIPプラットフォームの提供を開始する。また。従来の省電力IoTノード路線として、2018年6月には日本のロームと共同でセンサーノード向け開発ボードを発売している。

No image

ロームはWi-Sunと呼ばれる(一応世界標準規格だが、日本と一部台湾で少し使われているだけで、事実上日本独自の)ワイヤレス規格に対応したモジュールを提供しており、これにさまざまなセンサーと太陽電池パネル、ETA Computeのマイコンを組み合わせた格好。右上にあるのがETA ComputeのDIAL2という名前のMCUだ

ここでついにETA ComputeはそれまでのIP売りからチップ売りにビジネスを方向転換した。要するに小さな会社がIPを提供しても、誰も評価してくれない。であれば実際にチップを作って使ってもらえばわかるだろう、という発想だったのだろう。

(*1) 通常の回路では、スレッショルド電圧(おおむね0.5~0.6V)を下回ると、回路が状態を保存できなくなる。なので、スレッショルド電圧を下回る場合はもう回路への電力供給を止めてしまう。ただこの場合、復帰する際には回路の初期化が必要になる。したがって、煩雑に待機するような場合、待機状態により節約できる電力より、復帰のための初期化の電力が多くなりかねない。ETA Computeは、スレッショルド電圧を遥かに下回る電圧でも状態が保存できる仕組みを入れたことで、復帰時の消費電力を大幅に削減できることになる。

機械学習向けMCU「TENSAI」を発表

そして2018年10月には、いよいよ機械学習向けの機能を統合したMCUであるTENSAIチップをArm TechConの会場で発表する。「TENSAIというのはGenius(天才)の方か、それともDisaster(天災)の方か?」と一応ブースで確認したら「もちろんGeniusの方だ」という答えが返ってきたが、別に同社の経営陣に日系の人が居るわけではないらしい。

No image

これは画像認識のネットワークであるCIFAR10を実行しているデモボード。右中央のソケットの下にTENSAIチップがある(左のものはデバッグや開発用のインテルのCyclone FPGA)

No image

CIFAR10の実行画面。2種類のネットワークを同時に実行して、それぞれで物体認識を行なっている

No image

こちらは(確か)音声認識デモ

No image

こちらの主眼は(確か)音声認識中の消費電力を示すこと。「裏の製品(同社のブースの裏にSTMicroelectronicsがブースを出していた)の10分の1の消費電力だ」と説明員がアピールしていた

さてこのTENSAIチップであるが、この時点ではETA Computeの発想は「単に省電力なだけではIoTノードとして十分ではない。省電力で、しかもEdge AIを実行できる性能が必要になる」という方向に振られることになった。下の画像はこのあたりを端的に示している。

No image

結論から言えば、現状ではこうしたExtreme EdgeにもMCUではなくMPUが入る(Apple Watchなどその良い例だと思う)方向に推移しているようにも思われる

同社が目指すのは、“Extreme Edge”と呼ばれる、一番末端の機器向けである。それなり以上の容量を持つバッテリー、あるいは外部電源が使える機器をEdgeと分類し、それ未満の機器をExtreme Edgeと表現したわけだ。このあたりはArmが言うことろの“Endpoint AI”に近いかと思う。

Exterme Edgeの一例が、パレット(荷物を運ぶ際の台座)に取り付けられるトラッキングデバイスである。ここではAIが「いつ自身の情報を収集して、発信するか」を判断するために用いられることになる。

No image

段ボールの下の木枠がパレットで、そこに黒いトラッカーが付いてるのがわかる。ただこの場所では運送時にぶつけられて壊れそうな気がする

No image

Extreme Edgeでの機械学習例。言うのは簡単だが、実際には振動や音などの周囲状況からどう判断するかを作りこむのが難しいはずだ

圧倒的に高い性能を低い消費電力で実現

TENSAIの中身だが、構造自身はいたって常識的だ。マイコンのコアそのものはArmのCortex-M3という、おそらく世界で一番多いMCU(*2)で、それにDual MACのDSPと64KBのSRAM、それと周辺機器を組み合わせているだけだ。

No image

TENSAI EMC3531の構造。このうちCortex-M3コアと、図で緑色のSYSTEMブロック、茶色のSerial Interface、黄色のAnalogの各ブロックはサブスレッショルドで動作可能と思われる。DSPもそうなっている可能性はあるが、明言はされていない

実はこのDSPは、NXPのCoolFluxという、もともとはオーディオ処理用のDSPのライセンスを受けて実装しているものだ。構成はDual 16bit MAXとあるので、おそらくDSP16というタイプのものだろう。こちらもライセンスを受けたものなので内部構造そのものは一切手を入れられない。

ただETA Computeの場合、デジタル技術よりもアナログ技術に強みがある。具体的に言えば、IPとして提供されたもの(つまりRTLそのもの)には手は入れられないが、それを物理実装する際に独自のノウハウを注ぎ込める。

もともと2017年に発表したIPがまさしくそうしたものであり、TENSAIチップにもそうしたノウハウは注ぎ込まれた。

No image

1つ目は動作周波数に応じて電圧を可変する仕組みだが、インテルのSpeedStepなどと異なるのはこれをアナログで処理していることで、さらにそもそもサブスレッショルドでも動作するような(やはりアナログ的な)工夫も含まれている

この結果として、CPUコアは他社製品と比較して圧倒的に高い性能を、しかも低い消費電力で実現できているとする。

No image

比較対象はいずれもArmのCortex-Mシリーズを搭載する製品である。比較に利用されたのは、EEMBCのULPMarkという業界標準のベンチマーク

同じ動作周波数であってもより低い消費電力で動作するのであれば、逆に言えば従来のMCUでは性能や消費電力の壁にあたって性能が出せないという場合でも、TENSAIコアでは切り抜けられることになる。

またDSPはもともとCNNの実行に都合が良い、という話は前回もご紹介した通りだ。実はArmも、Cortex-M4の世代からDSP命令と呼ばれる命令拡張を追加しているが、これはいわば「DSP風」命令であって、実際の性能はDSPにはおよばないし、なにより消費電力が圧倒的にDSPより多くなる。

前回のCEVAもそのあたりを差別化要因として、「Armコア+CEVAのDSPという形で性能と消費電力のバランスを改善できますよ」という売り方をしている(*3)。

ETA ComputeもやはりCoolFluxを組み合わせているが、特徴的なのはCPUコアと非同期なことだ。これにより、例えばDSPでCNNのネットワークをブン廻している間はCPUの動作周波数を下げたり待機させたりすることで、省電力化が狙えることになる。

No image

CPUコアとDSPは非同期。InterruptやMailboxなどはCPU側へのオーバーヘッドが大きいし、RPCはレイテンシーが問題になることが多いのだが、このあたりをどう解決しているかは興味あるところだ

ETA Computeの説明によれば、STMicroのMCUをCPUコアだけで処理した場合に比べ、75倍の性能効率向上が図れたとしている。

CIFAR10は32×32ピクセルという非常に小さな画像を利用しての物体認識だから、MCUには手頃(ただし実用性は「?」)なネットワークであるが、TENSAIでは画像の読み込みやそのロードと最後の処理をCortex-M3コアで、3層の畳み込みはCoolFlux DSPで行なうという形で作業を分担している。

No image

最適化したからといってさらに10倍も効率上がるのだろうか?

CIFAR10以外のAIアプリケーション例として示されたのが下の画像だ。とにかく圧倒的に少ない消費電力でAIアプリケーションを駆動できるというのがTENSAIチップの最大のアドバンテージである。この省電力性を生かして、Extreme Edgeでもっとさまざまな計算処理をさせられるというのが同社の説明であった。

No image

CIFAR10以外のAIアプリケーション例。3V駆動で1mAでは3mW、500μAでは1.5mWほどになる。最後の項目が速度(Inferences/sec)であり、CIFAR-10の画像認識なら1枚あたり0.6mWsec=0.6mJ、2番目のオーディオ処理なら同様に1.5mJ。以下0.023mJ、0.5mJ、0.75mJという計算になる

(*2) Cortex-Mシリーズの最初の製品。ベストセラーというか、ロングセラーというか。ただ微妙なのは、その後で出たCortex-M0(廉価版)の方が、価格が安い分ひょっとすると上かもしれないところ。このあたりの集計はArmも出してくれていない。

(*3) Arm TechConにはしばしばCEVAがブースを出しており、「御社はArmの競合じゃないの?」と話を振ったら「いやいや、ウチはあくまでもDSPのIPを提供するだけで、汎用的な処理はMCUなりMPUが必要で、そこはArmに任せた方がいい。だから補完関係にあるわけで、Armさんとは仲良くやっていきたいですよ(棒)」という返事が。

チップを売るビジネスから ソリューションを売るビジネスに

さて、2018年にこのTENSAIチップことECM3531を発表したETA Compute。2019年にもArm TechConにブースを出していたので「去年からなにかアップデートあった?」と聞いたら「特にない」という返事が返ってきたあたりは、やはりチップ売りに切り替えてもそうそう顧客がつかめなかった、ということであろうか。

No image

CNNは目を引くアプリケーションであるが、それこそFFTやデジタルフィルターなど旧来の用途向けももちろんカバーする、と幅広くアピールしているのがポイント

そうこうしているETA Compute、2020年にふたたび方針が変わる。後継製品としてECM3532チップをすでにリリースはしていたが、新たにSynaptics(液晶のコントローラー大手:スマートフォン向けのタッチコントローラーや指紋認証などのソリューションを提供する)から1250万ドルのシリーズCの投資を受け、同社のTENSAI FlowというTENSAIチップ向けソフトウェアをSnapticsに独占ライセンスすることを発表した。

いわばこれまでのチップを売るビジネスから、ソリューションを売るビジネスに鞍替えした形だ。引き続きチップの販売は続けるとしているが、核になる技術を1250万ドルでSynapticsに売り渡したというのが正確なところか。

Synapticsは自社製品にAI/MLベースのアルゴリズムを組み込むに際し、ETA Computeの低消費電力チップ技術や高効率ML処理技術が大いに役に立つと判断したからと思われる。ただ、だからといって会社を丸ごと買収するほどのコストは支払えない(同社は累計で3100万ドル超の投資をファンドから受けている)というあたり、わりとギリギリの値段な気がする。

独立系スタートアップ企業がAI対応を標榜したところで、なかなか一本立ちするのは難しい、という昨今の半導体業界を象徴するような動きになっている感じである。

大原雄介(http://www.yusuke-ohara.com/) 編集●北村/ASCII

この記事をお届けした
グノシーの最新ニュース情報を、

でも最新ニュース情報をお届けしています。
  • このエントリーをはてなブックマークに追加