公司已经拥有大量可用于猎头技术人才的工具,但是一家新的初创公司希望通过将 GitHub 和 LinkedIn 的世界结合起来为特定软件开发创建最合适候选人的数据库来为招聘人员提供帮助角色——它通过使用 AI 从他们编写的代码中“推断”技能来做到这一点。
Prog.AI ,正如公司的名称,允许招聘人员根据他们的技术技能、他们使用的库,或者仅仅是他们对 GitHub 上的项目所做的贡献来搜索开发人员。
Prog.AI 于 2022 年在旧金山成立,是首席执行官Maria Grineva的心血结晶,她于 2020 年将之前一家名为 Orb Intelligence 的数据初创公司出售给了 Dun & Bradstreet; CTO Fedor Soprunov ,曾任俄罗斯科技巨头 Yandex 的机器学习研究员;和产品负责人Dmitry Pyanov ,曾在 Yandex 和 Replika 等公司的产品团队工作。
虽然招聘最初是公司的主要关注点,但 Grineva 的首款产品本周面向招聘人员开放了封闭测试版,Grineva 看到了广泛的用例范围,而不仅仅是帮助公司填补技术职位。这包括培养开发人员关系,例如要求他们加入社区或邀请他们为开源项目做出贡献;请求他们解决特定问题的专业知识;甚至帮助开发工具公司推销他们的产品。
“本周我们将为技术招聘人员推出 Prog.AI,4 月份我们将通过 Prog.AI 扩展我们的 SaaS 产品以促进开发人员关系,以帮助为开发人员构建工具的公司了解他们的 TAM(总可寻址市场),进一步了解他们现有的开发者社区,并接触到他们的目标受众,”Grineva 向 TechCrunch 解释道。
为了帮助启动其商业推动,Prog.ai 今天宣布它已经从总部位于德国的天使基金Angel Invest 、 Brooklyn Bridge Ventures和包括 Spotify 的第一批员工之一及其前首席技术官Andreas Ehn 。
分析那个
那么 Prog.ai 实际上是如何从公共源代码中推断技能的呢?好吧,首先,平台会执行 GitHub 的“ git clone ”命令,创建数百万个公共存储库和分支的副本。 Prog.ai 然后分析每个 git 提交,并检查代码片段、文件路径和提交的主题以弄清楚它是关于什么的。
“对于给定的项目,我们可以看到谁是核心架构师,谁开发后端或前端,谁专注于 UI/UX,谁构建 QA 和测试,谁是技术作家,”Grineva 说。
Prog.ai 还仔细研究 git 操作,例如拉取请求,包括拒绝和批准、评论和问题开放,这有助于 Prog.ai “理解”项目贡献者的不同角色和参与程度。
“我们不仅处理著名的开源项目,还处理来自 Coursera 或 Udemy 的‘宠物’项目、测试、分支,甚至是工程师在 GitHub 上公开的培训项目,”Grineva 补充道。 “总而言之,我们每年在 GitHub 上处理大约 10 亿次提交,以非常准确地了解每位工程师的技能。”
在幕后,Prog.ai 依靠 OpenAI 的GPT ,在备受瞩目的开源项目和 StackOverflow 文章上定制大肆宣传的语言模型,以帮助它获得代码质量分数等。

Prog.ai 配置文件示例图片来源:Prog.ai
Prog.ai 用户可以建立特定学科的顶级专家名单,例如“大型语言模型”或“计算机视觉”,并生成任何给定领域的顶级表演者排行榜。或者他们可以提交一个存储库列表,并根据他们所做的提交数量对所有贡献者进行排名。
实际上,招聘人员和公司可以根据他们想要的任何参数定制他们的搜索,包括技能领域、编程语言和经验年数。

Prog.ai 搜索示例图片来源:Prog.ai
但理解代码只是 Prog.ai 产品的一部分。
招聘人员的一个核心卖点是能够与软件开发人员联系,为此 Prog.ai 包含一个内置的电子邮件外展引擎,由销售参与平台Reply.io提供支持。
“用户使用我们的搜索来创建相关候选人的列表,然后他们可以创建个性化的电子邮件序列,提及候选人的名字,提及他们的项目,并解释为什么他们认为工作职位很适合他们,”Grineva说。

Prog.ai:电子邮件外展示例图片来源:Prog.ai
招聘人员可能还希望更全面地了解开发人员的技能、教育背景和工作经历,而这些可能无法从 GitHub 获得。这就是 LinkedIn 加入竞争的地方,Prog.ai 收集公开可用的数据并将其与 GitHub 上的相应个人对齐。这就是 Grineva 所说的平台的特殊之处——通过将来自两个广泛使用的平台的数据进行网格化,它可以构建更精细的潜在候选人图景。
“我相信加入 GitHub 和 LinkedIn 个人资料会带来很多价值,因为工程师通常不太擅长推销自己,而且往往甚至没有完整的 LinkedIn 个人资料,”Grineva 说。 “此外,在 LinkedIn 上,人们会自我描述自己,这意味着信息是主观的。应用一种标准的方法,根据他们实际的代码贡献来推断所有工程师的技能,不仅消除了主观性,而且意味着公司将能够统一评估候选人。”
媒人
当然,这些都不是完美的招聘渠道。将两个庞大的、完全不同的数据集放在一起并不是一件容易的事,而且这里可能有很大的错误空间,相似的名字和历史增加了混淆配置文件的可能性。这是假设一个人首先拥有 LinkedIn 个人资料,但他们绝对可能没有。但在幕后,Grineva 表示,他们已经采取了一些措施,至少可以解决其中一些潜在的陷阱。
“匹配两个大型数据集并非易事,因为人们在 GitHub 上提供的信息可能很少,许多工程师选择在 GitHub 上匿名,”Grineva 解释说。 “我们已经建立了一个专有的模糊匹配系统,它不仅考虑姓名、用户名和电子邮件地址,还匹配工作地点、专业知识和兴趣。”
最重要的是,Grineva 说他们使用计算机视觉来比较跨平台的个人资料头像,虽然它本身并不是万无一失的,但可以作为其他验证机制的额外工具。
在撰写本文时,Prog.ai 声称其数据库中拥有大约 70% 的个人资料的联系信息,这显然意味着 30% 的人缺少关键数据。就这一点而言,Grineva 表示,虽然他们希望在扩展时改善其详细联系方式的覆盖范围,但其潜在用例并不总是围绕着外展展开。
“另一个重要的用例是数据丰富,”她说。 “客户可以通过 GitHub 句柄、LinkedIn URL 或联系电子邮件来查找完整的候选人资料——在这种情况下,我们只能匹配我们拥有电子邮件的 70%。”
这里还有一头巨大的大象:Prog.ai 不就是在促进“陌生来电者”寻求联系开发人员吗?
“存在风险,但重要的是首先要认识到,招聘人员已经在尝试对开发人员进行冷呼叫,而这目前正在通过其他工具进行,一些技术招聘人员直接从 GitHub 中手动提取联系信息,”Grineva 说。 “也就是说,招聘人员目前对他们接触的开发人员的了解不好或有限,这意味着外展不是个性化的,而且机会通常不适合开发人员。结果,这些电子邮件被视为垃圾邮件。”
对于那些在 Prog.ai 支持的外展活动接收端的人,Grineva 指出该平台“完全符合GDPR ”,开发人员可以要求它删除或编辑他们的个人资料,以及选择完全退出电子邮件外展。
把钱拿出来
Prog.ai 还处于早期阶段,它正在尝试不同的计划,但该公司本质上是在运营基于 SaaS 的订阅模式,定价基于用户访问的联系人数量。这从每月最多 100 个联系人的“免费”开始,一直到“招聘”计划,即每月 530 美元的高级搜索功能和 3,000 个联系人。它还提供具有自定义定价的企业计划,可应要求提供。
也不能忽视其他无数的招聘解决方案,涵盖从 LinkedIn 自己的Talent Solutions 产品到Zoominfo 、 SeekOut 、 TalentOS和HireEZ 的所有内容。但 Grineva 表示,Prog.ai 完全专注于技术人才及其 GitHub 扫描智能,这让它与众不同。反过来,这可能意味着更有针对性的猎头工作,招聘人员和候选人的目标更加一致。
“作为一名工程师,我收到了很多招聘人员发来的与我无关的信息,并且亲眼看到了这个问题,”Grineva 说。 “我认为这主要是一个数据质量问题:招聘人员只是没有足够的关于我的信息来为我匹配有趣的机会。我们的目标是降低开发人员目前收到的噪音水平。通过为招聘人员提供更好的信息,我们相信这对开发人员和招聘人员来说都是双赢的。”
Prog.ai 希望通过从最初发布在TechCrunch上的Paul Sawers的 GitHub 代码推断技能来帮助招聘人员找到技术人才