在过去的19个月里,我写了《打造工程策略》(Crafting Engineering Strategy) ,这是一本关于创建工程策略的书。我也越来越多地在工作中使用大型语言模型。不出所料,这两个理念的交集是我经常思考的一个话题。我一直在思考,在这个越来越多的写作需要大型语言模型作为中介的世界里,作者,尤其是长篇作品的作者,应该扮演什么角色?
我经常听到一种观点,认为法学硕士首先就是对作者作品的大肆掠夺。这是真的,法学硕士就是如此。曾经有一个脚本可以让你检查哪些书已经被加载到 Meta 的 LLaMa 中,而我当时写的每本书都被收录其中,而且没有一本是经过我同意的。然而,我很久以前就接受了网络抄袭,这次我觉得也没什么不同,尽管是更大的参与者所为。使用这篇文章的人会继续使用它,超出我希望的限制,而我对将我宝贵的脑力投入到追逐数字或法律迷宫中不感兴趣。
相反,我一直在思考这种转变对作者来说如何才能顺利进行。我最喜欢的想法是将书面内容作为思考的“数据包”。购买某人的书籍/“数据包”,然后将其上传到你的法学硕士课程中,你就可以立即进行操作,就像你了解这本书的内容一样。
让我们先举个例子。假设你需要高管入职方面的帮助,并且你购买了一本《工程主管入门书》 ,你可以在 Anthropic 的 Claude 中创建一个项目,并将这本 LLM 优化版的书籍上传到你的项目中。
您的 Claude 项目可能如下所示。
设置完成后,您可以要求它帮助您创建入职计划。
这条指导很有道理,主要摘自《你担任 CTO 的头 90 天》 。和往常一样,你可以反复修改最初的提示,包括你想在计划中包含的更多细节,并进行后续改进,以改进格式等等。
有一件有趣的事,我目前没有《工程主管入门》的数据包!为了解决这个问题,我用所有带有“主管”标签的博客文章创建了一个数据包。我使用了一个打包 Hugo 博客文章的脚本,该脚本是我用 Claude 3.7 Sonnet 的提示符生成的。
该脚本的输出通过以下方式传递到repomix :
repomix --include "`./scripts/tags.py content executive | paste -d, -s -`"
paste
的混乱之处在于将tags.py
的多行输出转换为 repomix 知道如何使用的逗号分隔列表。
这是一个非常巧妙的模式,它开始触及我所看到的当前环境下作家的长期优势:如果你是一名作家,并且能够访问你的原始内容,那么你可以创建一个针对特定问题的数据包来讨论这个问题。你也可以把这个数据包分享给其他人,或者用它来回答他们的问题。
例如,有人就我最近的一篇博文问了一个非常详细的后续问题。这个问题很长,而且我当时正在周末旅行。我已经设置了一个 Claude 项目,其中包含《Crafting Engineering Strategy》的内容,所以我直接把问题逐字逐句地传入了那个项目,然后把答案发回给了提问者。(我确实需要 Claude 修改一次答案,以便更专注于我认为答案中最重要的部分。)
不管怎么说,这答案不算完美,但已经很不错了。如果提问者有正确的数据包,他们自己就能拿到,不用我来决定是否回答。
然而,这篇文章与其说是担心读者,不如说是担心作者。如果未来人们不再阅读我们的作品,作为作家,我们的竞争优势又在哪里呢?也许他们还会以数据包之类的形式购买我们的作品,但书籍销量,就像博客流量一样,肯定会受到负面影响。
在贸易领域,如今机器能够理解我们长期以来以文字记录下来的思维。我的高管学习圈里流传着一个笑话,说我针对每个话题都写了一篇博客文章,这多少有点道理。这意味着我即将迎来一个独特的机会,将“几美分即可按需获取的情报”与我过去二十年作为一名作家积累的书面思维细节结合起来,从而实现自我提升。
现有的工具还不够完善,不过,结合销售类似“工艺工程策略”之类的数据包,以及像克劳德的项目这样的工具,是一个不错的开端。具体细节可以通过多种方式整合,但我乐观地认为,在这个新世界里,即使具体的形式发生了变化,写作的力量也会增强,而不是减弱。
(无论如何,我也不认为人类读者会消失。)
如果您对这个想法的完整版本感兴趣,可以从这里开始阅读《AI 伴侣:打造工程策略》的完整版。数据包将在未来几个月内通过 O’Reilly 提供。
如果您是现有的 O’Reilly 作者并且对此想法持怀疑态度,请不要担心:我与他们合作签署了一份定制合同,这种用法 – 据我所知,虽然我不是律师并且不提供法律建议 – 超出了我之前与我之前的书签署的默认合同的范围,并且大概也是大多数其他人的合同的范围。