会是替代st m7的未来之选嘛,RISC-V gap8与cortex m7性能测试比较

2020-01-07 19:19发布

本帖最后由 reloaded 于 2019-6-17 22:37 编辑

很多年前,st的m3因为atmel缺货而走上了主流,今天,由于某某站的缘故,以及ai市场大大举入侵嵌入式,我们开始把目光投向risc-v,他会是第二个stm32嘛
参考https://greenwaves-technologies. ... m-m7-embedded-cnns/

图片刷不出来可以打开网页,有。

不知道从何时开始,低端arm控制器和mpu也开始炫起了ML大法,各种NN都开始port到上面来。且不说性能如何,至少有这个玩意会比别家多一些噱头。。arm公司也不闲着,他
已经准备了下一代arm v8.1m架构,给mcu加入了neon协处理器,类似于矩阵计算阵列的多核mini版本,提供NN算法的加速。同时彻底降低了主控单元的计算负载。
而这一点,也是riscv们提前开始占领的高地。现在我们已经看到有厂家制造了一颗8核心加1主控的低端ai加速用的riscv单片机。
它依旧是单片机。主控250mhz,协处理器175mhz。

作为评测对比,它用gap8和运行在217mhz的stm32h7进行了对比
同一套CNN算法,stm32h7              99ms         
                          gap8(175mhz)9ms
功耗方面            stm32h7             60mw    不得不说这个功耗还是很不错的。
                         gap8                    70mw
并且risc v芯片的全功率运行时候电压是1v,比stm32的3.3v要低很多
只看数学计算性能,riscv是最高频率工作下的stm32h7的五倍。
功耗它俩在同一水平线。(几乎)同频率的话。
设计原理在:
Why is GAP8 using so few cycles? Well firstly we’re running on 8 cores and GAP8‘s extremely efficient architecture for parallelization is giving us a speed-up factor of somewhere between 7 and 8 times. Secondly the optimized DSP/SIMD instructions in GAP8 are giving fine grained parallelization on the convolution operations. Finally our fine grained control over memory movement is giving us a real benefit in the amount of cycles used to load and store weights, input and output data from the CNN graph nodes. All of these factors allow us to achieve the same execution time for the inference of 99.1ms at a clock speed of 15.4Mhz. This, in turn, allows us to run the cores at 1V leading to a power consumption during the operation of 3.7mW. Here we are really benefiting from the shared instruction cache in the cluster which decreases the cost of running the 8 cores by fetching instructions only once.

The last row in the table shows GAP8 executing the CNN at full clock speed. Here the cluster is working at 1.2V and its maximum clock speed of 175 Mhz. We are able to complete the inference in 8.7ms. A performance increase of 11 times versus the M7 core at a power level that is reasonably similar of 70mW. The energy consumed is obviously less than the M7 since it is over a shorter period but from an energy perspective the GAP8 is less efficient at this operation point.
更早一点的测评数据汇总在 https://greenwaves-technologies.com/gap8-cnn-benchmarks/
按照它们官方的说法,今年年中还会进行产品的第二次升级,把频率做到协处理器超200mhz,做到传统arm m7性能的五到八倍。以期和很快就会出样品的次时代arm mcu
集成NEON多核的AI单片机进行抗衡。
但是有个坏消息,这家公司的样品居然是四十欧一片。晕倒了。。
这种针对ai优化的mcu产品是有市场需求的。他可以作为camera的辅助检测。也可以做超低端的face recognition 大概做个婴儿动作检测比较合适。
由于我国的特殊市场需求非常之大,我依旧看好这类监控和识图类芯片的前景。

PS  目前所有的risc-v产品都没有以太网的IP,特别是低端控制器里的。所以要用的时候只能用wifi替代网络扩展。
   甚至连usb 3也没有。这个问题不大。usb数量上也不占任何优势。riscv的唯一优势就是它更像是一款普通人能开发升级的fpga。
  超低端的那种。破解起来初期成本较大。国内的合肥某手表公司已经量产了一款,还有一个做智能锁的芯片厂也量产了一款
他们都不需要以太网接口。
如果你要用以太网接口的有线接口,不要看了!!!!!!!!!!!!!!!!!!!!!!!!

PSS   最大的dsp厂家是TEXAS INSTRUMENTS,和ADI, 都是美国的。美国美国你懂得
友情提示: 此问题已得到解决,问题已经关闭,关闭后问题禁止继续编辑,回答。
该问题目前已经被作者或者管理员关闭, 无法添加新回复
13条回答
reloaded
1楼-- · 2020-01-07 23:07
本帖最后由 reloaded 于 2019-6-17 22:29 编辑

关于国内某挖矿芯片厂的riscv产品吐槽
我不太相信一个挖矿设计公司能把产品线做到三到五年不消失。作为消费型ic,他们并没有那种信任感。相反欧洲人设计的这个greenwave,也就是苏黎世和乌得勒支联合开发的产品,在得到了国内某厂的大力入股之后,看起来安全和长期供货的概率更大。价格上,如果risc-v能做到10usd以下,还是有戏的。
但外设的匮乏,和可靠性测试不够多的现实,可能很多人还不太会完全切入到这个平台。单纯从使用开发上,IDE也没有mdk这样用起来顺手的人机界面
好在烧写程序都是一样 的。RTOS也有了。哈哈哈哈,没有rtos,我都看都不用看了。

还有一个riscv产品线,就是很多小企业在搞的,拿超低端fpga来做。价格低于五美元。那个用起来感觉和atmel的mega16类似
大家可以体会是啥样了。高级版本的是用xilinx的大片子跑豪华版ip。看起来外设代码还是不足。

如果你们有看过挖矿公司的risc-v的demo游戏,会发现居然真的可以用图像识别做小游戏。而且功耗能做到非常之低。从这点上看,传统的m4和最贵的m7还无法做到。
功耗问题会在大规模的工厂自动化里显现出来,特别是一个环境下,有几千个采集节点的时候出现。以前我们是用arm a9来做工业摄像,图形捕获的。这个成本是大规模生产线无法接受的。
所以,riscv 确实是另辟蹊径,用它的独特的卖点。
colinzhao
2楼-- · 2020-01-07 23:37
 精彩回答 2  元偷偷看……
reloaded
3楼-- · 2020-01-08 00:39
colinzhao 发表于 2019-6-17 22:19
第一句话就是错的。

那是你高看了arm阵营的公司,没有零八年的经济危机,现在你还在用atmel的arm7跑。
现在针对arm系的恐慌,恰恰是riscv大势的好机会。
没有什么是不可能的。
atmel死于供货,而现在整个arm系特别是美系,都有全军覆没的危险。国产高仿32们也是唇亡齿寒。
tim
4楼-- · 2020-01-08 05:14
截个图。。

Screen-2019-06-17_22-21-12.jpg (60.19 KB, 下载次数: 0)

下载附件

2019-6-17 22:25 上传


reloaded
5楼-- · 2020-01-08 05:21
tim 发表于 2019-6-17 22:27
截个图。。

在我国,做DANG的好儿女,做DANG的好帮手,永远都有肉吃啊。。
reloaded
6楼-- · 2020-01-08 10:41
按国外的说法,我国是要做到一人俩camera的量,城市中心无死角。据说那一个省就卖了一亿枚camera
不过我依旧看好它在工业自动化上的大规模使用,只要它的识图速度不吹牛x和功耗不作假。
别的安全类,它想要动国家采购的蛋糕,暂时很难,除非是复旦微电子自己开片子用它的ip。其它地方,大家也都看到了,这个芯片最大的不足就是外设匮乏。
以至于它的舞台只能在小小的ai上跳跃

一周热门 更多>