欢迎来到专利数据周! 到二月底,我开始撰写一篇关于使用专利来衡量创新的帖子(类似于这篇关于学术引用是否可以很好地衡量新想法影响的帖子)。它变成了四个帖子!由于它们都密切相关,我决定在一周内将它们全部发布到子堆栈和播客上:
也就是说,如果您等不及周四,所有四个帖子都已发布在 New Things Under the Sun (.com) 上 – 只需单击上面的链接即可。如果您懒得阅读一篇以上关于使用专利数据衡量创新的文章,我的建议是阅读最后一篇( 我们可以从专利数据中了解创新吗? ),因为它试图总结和综合什么其余的。但除此之外,它们会以每天一个可管理的(?)的速度进入您的收件箱或播客提要。 现在,我们来看看这个四部分系列的第一部分…… 感谢您阅读《阳光下的新鲜事》!免费订阅以接收新帖子。 有多少发明获得专利?本文将随着学术文献的发展而更新;您可以在这里阅读最新版本。您可以在上面收听这篇文章,或者通过此处的大多数播客应用程序收听。 出于多种原因,专利表面上是发明的有用数据源。发明者有动力寻求专利,因为获得专利意味着您有权在 20 年内禁止其他人使用您的技术。因此,我们可能认为最重要的发明都会有相关专利。与此同时,专利审查员会对发明进行筛选,以确保获得的发明是新颖的、非显而易见的且有价值的。因此,我们可能认为专利主要包含真正发明的信息。最后,当一项发明获得专利时,我们会获得大量相关信息:发明的描述、发明人是谁、他们居住在哪里、技术类别的分类、引用的参考文献的信息等等。 无论如何,专利作为数据就是这种情况。事实上,关于创新的研究论文使用专利作为创新的数据集是很常见的。但事实上,很多发明并没有申请专利。这是出于多种原因。首先,某些形式的知识创造,例如抽象思想,是不可申请专利的。二是专利保护不完善。二十年后专利到期,竞争对手可能能够“围绕”专利进行“发明”,而执行成本高昂且不确定。第三,申请专利要求披露有关发明的信息,这实际上迫使您放弃秘密保护发明的选择。第四,专利申请不是免费的。 如果我们打算使用专利作为衡量创新的一种方式(暂且不考虑它们是否是激励创新的好方法的问题),那么一个自然的问题是:有多少发明获得了专利? 这是一个很容易陈述的问题,但由于一些原因而难以果断地确定。首先,除了少数例外,我们通常没有详尽的发明清单,这可以让我们计算获得专利的份额。其次,如果你尝试列出这样一个清单,你会发现将创新清晰地划分为不同的离散发明是很有挑战性的。例如,许多新产品展现出多项技术进步;这是多项发明还是一项?第三,专利与发明之间可能不存在一对一的匹配。一项将多项突破捆绑在一起的发明可能会受到许多专利的保护,而这些专利似乎与该发明只有松散的联系。一项专利可能会保护许多不同的产品,这些产品依赖于不同方面的突破。 研发人员及专利尽管如此,我们还是可以得到一个有用的近似答案。首先,我们假设进行研发的公司可能也拥有发明,然后看看有多少进行研发的公司也拥有专利。 Mezzanotti 和 Simcoe (2023)报告了美国人口普查局和国家科学基金会在 2008 年至 2015 年间进行的商业研发和创新调查。这项调查从具有全国代表性的样本中询问了超过 40,000 家美国公司对知识产权的使用情况。 只有一小部分公司(大约 6%)进行研发。在这样做的企业中,大多数并不寻求专利保护。事实上,只有 18% 进行研发的公司同时寻求专利保护。但这一统计数据对于受专利保护的发明比例来说是一个误导性的指标。这是因为企业的规模非常不平等:经济的特点是少数非常大的企业(进行大量研发)和大量非常小的企业(它们在研发总量中所占的比例很小)。 2015 年,美国国内研发活动的约 9% 是由员工少于 100 人的公司完成的;员工超过 100 人的公司则完成了其余 91% 的工作。大公司也更有可能寻求专利。虽然大多数进行研发的公司并不寻求专利,但少数进行专利的公司也进行了大部分研发。事实上,拥有专利的企业约占研发支出总额的90%。 你可以直接问如上所述,我们通常没有可以让我们计算专利份额的发明列表。但作为替代方案,我们可以要求公司尽可能地估计份额。 Cohen、Nelson 和 Walsh (2000)描述了 1994 年对美国制造业约 1500 个研发实验室进行的一项调查的结果。在这项调查中,公司被要求估计获得专利的创新的百分比。在所有行业中,平均而言,企业报告称,他们为 49% 的产品创新和 31% 的工艺创新申请了专利(见附录表 A1)。 科恩等人。 (2002)报告了向日本大型研发制造公司提供的类似调查。受访者估计 62% 的产品发明获得专利,42% 的工艺发明获得专利(见脚注 19)。 但请注意,这些数字存在很大差异。在美国的调查中,药品制造商表示他们对 96% 的产品申请了专利;玻璃制造商为 6% 的产品创新和 2% 的工艺申请了专利。因此,至少在 1994 年,美国公司自己估计他们只为三分之一到一半的发明申请了专利,至少在制造业是这样。日本的这个数字略高一些。值得注意的是,受访者估计获得专利的发明比例高于他们认为专利保护有效的比例。例如,美国受访者声称为其约一半的产品发明申请了专利,但估计专利仅对其约 35% 的产品发明起到了有效保护作用。 不管合理与否,经济学家往往对自我报告的调查数据有些警惕。因此,为了获得有关有多少发明获得专利的一些非调查证据,接下来让我们看一些实际上确实起草了发明清单的论文,然后看看清单上有多少发明获得了专利。 将专利与发明列表相匹配也许这种方法最有效的部门是制药部门。这是因为在这个领域,发明实际上有点像离散事件;它们实际上是 FDA 批准的不同的小分子。除了提供美国所有声称具有医疗功效的药物的完整记录外,FDA 还收集并发布哪些药物目前受专利保护的信息(旨在为仿制药制造商提供指导) 。 杜瓦苏拉等人。 (2023)分析了这些数据,发现自 1985 年以来批准的新药中有 68% 至少拥有一项相关专利。但这包括非常小的新药批准,相当于对现有药物的小幅调整。如果我们将注意力限制在新的分子实体药物上,即那些具有新颖活性成分的药物,受专利保护的比例将上升到85%。这是大部分发明,但也低于 Cohen、Nelson 和 Walsh (2000),后者在调查中发现药品制造商声称为其 96% 的产品申请了专利。 此外,人们普遍认为制药行业是一个不寻常的案例,其中专利的作用特别好。从更广泛的角度来看,另一种特别丰富的文献利用创新奖竞赛来获取发明清单。这些论文中的每一篇都会获得所有获奖发明或正在竞争奖项的发明的列表,然后查看有多少比例的发明也享有专利保护。这些文献跨越了许多国家和时期。
总而言之,这些论文中的大多数发现,大约 10-30% 的与奖项相关的发明也受到专利保护,一项研究发现在日本这一数字接近 100%。如果我们专注于涵盖二战后时代的论文,这可能与当今的专利发明份额最相关,那么我们从 Fontana 等人那里得到的结果是 9.1% 的低值。 (2013),而 Shimizu 和 Hoshino (2012) 则接近 100%。 Brunt、Lerner 和 Nicholas 发现,在 1940 年之前的几年里,大约 30% 的农业奖获得者获得了专利。除了 Shimizu 和 Hoshino 之外,这些估计值明显低于调查回复中获得专利的发明的平均比例来自科恩、尼尔森和沃尔什。 让我们看另一项研究,该研究也说明了将专利分配给发明在概念上是多么棘手。 阿金特等人。 (2023)使用尼尔森零售测量服务数据来获取有关新消费品获得专利的频率的信息。他们的数据集涵盖了 2006 年至 2015 年间销售的超过 100 万种产品的数据,占杂货店和药店销售的很大一部分。这让他们能够将发明识别为新的 UPC 代码;例如,一种新型的一次性杯子,在上市时会被分配一个新的UPC代码。他们还拥有有关所售产品的产品属性的数据,他们用这些数据来识别更大和更小的创新(具有以前未见过的产品属性的新产品比没有的新产品是更大的创新),但我现在将讨论放在一边。重要的是,他们再次拥有该领域相当有代表性的新产品清单,并且由于他们知道公司的身份,因此他们还可以找到与这些新产品相关的所有专利。 Argente 和合著者并没有试图确定产品和专利之间的一对一匹配,而是查看公司是否拥有与其推出新产品的产品类别相关的专利。为此,他们依赖于尼尔森将每种产品归入 1,000 多个不同产品类别之一的事实。 Argente 和合著者将手工挑选的有关产品类别的维基百科文章与尼尔森提供的每个产品类别的简短描述相结合,为每个类别构建了文本描述。然后,他们使用聚类算法将这 1,000 多个类别分为 400 个聚类,这些聚类使用相似的文本来描述产品类别 – 例如,一次性杯子和一次性盘子可能会被分组。然后,他们查看公司拥有的哪些专利在文本上与这些集群的文本接近。简而言之,他们会查看一家公司是否拥有使用类似词语(在其标题、摘要等中)作为描述其活跃产品类别的词语的专利。当他们这样做时,他们发现 23% 的新产品是由拥有与该产品类别相关的专利的公司推出的。 大于零,小于一半综上所述,大多数研发都是由至少拥有一项专利的公司进行的。在制药领域,我们可以非常有信心大多数(但不是全部)新药都获得专利。在制造业中,如果我们调查企业,他们声称用专利保护大约一半的产品和三分之一的工艺发明。但如果我们看看获奖或参加有奖竞赛的发明所占的比例,我们通常只能发现专利匹配的概率为 10-30%(除了一个主要例外)。这也与消费品公司拥有与其推出新产品的产品类别相关的专利的比率有关。 我们在这里得到了三种不同的估计:90%的研发是由专利持有者进行的,根据调查证据,30-60%的发明获得了专利,大约10-30%的发明可以与专利相匹配。为什么会出现分歧? 不难将与专利相关的研发所占的极高比例与其他指标相协调。它只是意味着公司为其研发的部分而非全部工作申请了专利。 1虽然调和调查和基于匹配的估计比较困难,但有一些因素正在发生。其中一个问题取决于样本中有哪些人。获奖论文包括来自私营部门之外的创新,这些部门申请专利的可能性较小。基于调查的论文主要基于相对较大的制造企业,而大企业更有可能申请专利。正如我们所看到的,不同行业的专利倾向也存在很大差异,而且所涵盖的行业也不同。最后,提交发明参加有奖竞赛的人可能不同于那些通过专利寻求对其发明的认可或奖励的人。 另一个因素是,调查可以仅根据阅读专利来找出看似与发明无关的专利,但该领域的技术人员会认识到这些专利实际上是相关的。我们可能期望发明者更好地了解哪些看似无关的专利实际上与他们的发明相关,事实上,当我们让发明者自我报告他们申请专利的发明份额时,我们确实发现更高的专利申请率。 Brunt、Lerner 和 Nicholas 指出,农业技术竞赛获奖发明中有 28% 在获奖公告中报告了专利保护,但他们只能为 22% 的获奖者找到专利。清水和星野也依靠专利保护的自我报告,发现几乎所有大河内奖获得者都享有某种专利保护;相比之下,丰塔纳等人。 (2013) 在亚洲研发 100 强获奖者中,只有 25% 的人能够将发明与专利进行匹配。我们不知道丰塔纳等人的发明有多少。 (2013)的研究来自日本,但这可能占很大一部分,因为即使到 2004 年,日本的研发支出也超过了韩国、中国和台湾的总和。科恩、尼尔森和沃尔什的调查结果平均高于专利与奖品匹配所暗示的水平,甚至高于 FDA 关于受专利保护的药物的数据。 阿金特等人。 (2023)也有关于这个匹配问题的一些证据。回想一下,他们的方法涉及根据专利文本与不同产品类别相关文本的相似性,将专利分为不同的相关产品类别。为了验证他们的方法,他们利用了这样一个事实:自 2011 年以来,公司已经能够在网站上列出保护其产品线的专利。目前很少有公司利用这项权利,但阿金特和合著者至少可以看看宝洁公司和金佰利公司报告的保护其各种产品线的专利。这提供了一些有关专利持有人认为其专利与哪些产品类别相关的信息。他们发现基于文本的算法在大约 80% 的情况下会选择“正确”的产品类别(此处定义为专利持有人报告为相关的产品类别)作为其第一或第二选择。但在很大一部分情况下(超过 10% 的时间),基于文本的方法并不是很接近;它没有识别专利持有人所说的与文本接近相关的产品类别。总而言之,我认为专利与发明匹配的困难是我们将匹配文献(发现专利匹配率约为 10-30%)视为下限估计的原因。当专利与发明具有相似的文本和相同的发明人时,错过相关专利似乎比错误地将专利与发明相匹配更容易。 那么,有多少发明获得专利呢? 可能超过零,但不到一半。这足以让我们确信专利登记册不是发明普查。相反,它是一个样本。好消息是,每年有数十万个新专利,这个样本足够大,足以让我们进行统计分析和学习有趣的东西。坏消息是,这不是随机样本,而是有偏差的样本:某些发明比其他发明更有可能出现在专利记录中。对专利数据进行良好分析的大部分挑战是理解和纠正这些偏见。 谢谢阅读!本系列的下一篇文章将于明天发布到 Substack – 敬请期待!与往常一样,如果您想总体讨论这篇文章或创新,让我们喝杯虚拟咖啡。请发送电子邮件至 [email protected],我们会将一些内容添加到日历中。 1
值得注意的是,大约 7.5% 的拥有专利的公司表示其研发工作为零。请注意,这不一定是专利的 7.5%,而是拥有专利的公司。 《阳光下的新鲜事》今天免费。但如果您喜欢这篇文章,您可以通过承诺未来订阅来告诉《天下新鲜事》,他们的文章很有价值。除非他们启用付款,否则您不会被收取费用。
© 2024马特·克兰西 |
有多少发明获得专利?
专利数据周第 1 篇文章
͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏