
假设你有几个字符串,你想统计每个字符串中字符!出现的次数。如果你是一位老派程序员,在 C++ 中,你可能会用以下方法解决这个问题。
size_t c = 0 ; for ( const auto & str : strings ) { c += std :: count ( str . begin (), str . end (), '!' ); }你还可以使用更高级的量程。size_t c = 0 ; for ( const auto & str : strings ) { c += std :: count ( str . begin (), str . end (), '!' ); }
for ( const auto & str : strings ) { c += std :: ranges :: count ( str , '!' ); }诸如此类。for ( const auto & str : strings ) { c += std :: ranges :: count ( str , '!' ); }
但如果你想跑得更快呢?或许你会想用汇编语言重写这个函数。我决定这么做,并且想用 Grok 和 Claude 作为我的 AI,来一场友谊赛,享受其中的乐趣。
我先编写了自己的函数,然后让人工智能用汇编语言对其进行优化。重要的是,它们知道我使用的是哪台机器,所以它们开始编写 ARM 汇编代码。
经过反复提示,我得到了以下函数。
-
count_classic:使用 C++ 标准库std::count作为参考。 -
count_assembly:一个基本的 ARM64 汇编循环(逐字节比较)。由 Grok 编写。 -
count_assembly_claude:Claude 的 SIMD 优化版本,使用 NEON 指令(16 字节块)。 -
count_assembly_grok:Grok 的优化版本(32 字节块)。 -
count_assembly_claude_2:Claude 的进一步优化版本(64 字节块,具有多个累加器)。 -
count_assembly_grok_2:Grok 的最新版本(64 字节块,改进了累加器处理)。 -
count_assembly_claude_3:Claude 的最先进的版本,进行了额外的优化。
你明白我的意思。
那么,性能如何呢?我使用长度不超过 1 千字节的随机字符串。在所有情况下,我都测试了函数是否能提供正确的计数结果。我没有仔细检查代码,所以代码中可能隐藏着一些错误。
我记录每条字符串的平均指令数。
| 姓名 | 指令/字符串 |
|---|---|
| 经典 C++ | 1200 |
| 克劳德集会 | 250 |
| grok 组件 | 204 |
| 克劳德集会 2 | 183 |
| grok 组件 2 | 176 |
| 克劳德集会 3 | 154 |
通过反复优化,我将指令数量减少了八倍。运行时间也相应缩短。
我们能让AI用C语言重写出最佳方案吗?可以,不过需要用到SIMD指令集。所以,在这种情况下,保留汇编代码没有任何好处。
一个悬而未决的问题是,人工智能能否找到一些使用 C 或 C++ 等高级语言无法实现的优化。这是一个很有意思的问题,我稍后会尝试解答。就目前而言,人工智能已经可以胜过我的 C++ 编译器了!
原文: https://lemire.me/blog/2026/04/05/can-your-ai-rewrite-your-code-in-assembly/