嗨朋友们!
我刚刚发布了我的第一个 Web 开发项目!
有一个名为 Game Sentence Miner 的工具,它使用 OCR 从屏幕上抓取文本,并允许您在字典中查找该文本。
它将其写入数据库文件:
- 文本行
- 你在哪里读到的
- 你什么时候读的
我以为……
“我可以从这些数据中了解到什么统计数据?”
因此我开始制作我的第一个 Web 开发项目——统计页面!

值得注意的是,它具有一些很酷的功能:
- 每日阅读概览
- 您正在玩的当前游戏的概述
- 您玩过的所有游戏的概览

因为我既有文本行,也有文本出现的时间,所以我可以猜测很多关于你阅读的事情。
如果您阅读了一段文字,然后离开 2 分钟,我认为您已经离开,因此如果您在 2 分钟内按下“下一行文字”,我认为您正在积极阅读。
这让我可以计算很多东西。

我制作了一个 GitHub 风格的阅读热图,其中包含您的阅读记录和每天阅读的平均时间。
我还有很多统计数据,例如:
- 随着时间的推移,您的阅读速度有多快?
- 您每天花几个小时阅读?
- 随着时间的推移,您阅读了多少个文本字符?
以及汉字热图:

每读一个包含汉字的句子,它都会对这些汉字进行 +1 处理。读的次数越多,它的颜色就越接近青色。
如果您读过一个汉字 500 次,我认为您就非常了解它了,所以它会变成青色。
我还添加了使用html2canvas的屏幕截图功能,以便您可以拍摄像我上面拍摄的一样漂亮的屏幕截图 🙂
Anki 集成
我也与 Anki 集成

因此,如果您在阅读时经常看到汉字,但该汉字不在任何 Anki 卡片中,您可以在这里看到!
如果你想知道“嗯,我什么时候读过《松》?”
您可以点击汉字并实时搜索您读过的每个句子:

这样你就可以准确地看到你以前在哪里读过这个汉字。
数据清理

您还可以删除重复文本,因此,如果在同一个游戏中 5 分钟内出现相同的句子,我会认为它是重复的,您可以将其删除。
您还可以使用正则表达式清理文本:

或者删除您不关心的整个游戏。