news 2026/3/5 9:20:04

作为数据科学家的 Medium 旅程:6 个月,18 篇文章,3,000 名关注者

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
作为数据科学家的 Medium 旅程:6 个月,18 篇文章,3,000 名关注者

原文:towardsdatascience.com/my-medium-journey-as-a-data-scientist-6-months-18-articles-and-3-000-followers-c449306e45f7

我从 2024 年 5 月开始在 Medium 上撰写数据科学和 AI 内容。这是我的第六个月,我刚刚达到了一个重要里程碑——3,000 名关注者!我为我的成就感到非常自豪。

在这篇文章中,我将分享这个旅程是如何开始的,我写了什么,以及我学到了什么。此外,作为一名数据科学家,我总是喜欢分析自己的数据。我收集了我的 Medium 统计数据集,包括文章浏览量👀,阅读量📖,点赞👏,收入💵等。加入我,我将使用数据来分析我的 Medium 经历,并分享我的数据驱动写作策略

https://github.com/OpenDocCN/towardsdatascience-blog-zh-2024/raw/master/docs/img/8de3a3497da223eb0d1be437ace3487d.png

由 DALL·E 创建的图像


我的 Medium 旅程概述

一切是如何开始的

我的写作习惯可以追溯到我在 Medium 上开始写作之前。自 2018 年以来,我一直在运营我的数据科学作品集网站,那是我开始第一份全职工作的时候。我在那里发表文章,并偶尔在 LinkedIn 上分享它们。这帮助我与数据领域的亲朋好友和同事建立了联系。今年早些时候,我发表了一篇关于我对自定义 GPT 的实验的文章,在 LinkedIn 上获得了近 10k 的浏览量。这已经很不错了,但也让我想知道如何触达更广泛的受众。

同时,我自 2020 年以来一直是 Medium 会员。对我来说,学习日常工作之外的知识和跟上行业的新技术非常有价值。在行业内工作了七年,我觉得是时候站在另一边,与社区分享我的知识(并且收回我的每月 5 美元 Medium 订阅费 😀)。

故事就这样开始了。我最初尝试在 Medium 上发布一些旧文章,然后转向创作全新的内容,将文章提交给像 Towards Data Science 这样的出版物,并且每月发布两到四篇新文章。

我写的内容

我的文章涵盖了这三个类别:

  • 技术教程:许多人来到 Medium 是为了学习如何做 X,就像我一样。因此,我的大部分文章都属于这一类别。这包括我收入最高的文章:精通 SQL 优化:从功能性到高效查询。

  • 学习心得:我们不可能知道一切,但这没关系。我喜欢探索新事物并在 Medium 上分享我的发现。例如,我有一系列关于比较 ChatGPT、Claude 和 Gemini 在各个数据科学和分析任务上的文章系列。

  • 我的职业故事:在行业内工作了七年,我有许多职业故事和反思。事实上,给我带来最多点赞和新粉丝的文章是330 周的视觉数据化:我的旅程和关键要点。

写作对我在 Medium 上的帮助

在 Medium 上写作当然帮助我更多地参与数据科学社区并赚取一些额外收入。但它给我带来了许多更多的好处,包括:

  • 这让我更有信心表达自己的观点。我作为读者已经关注了“数据科学之路”多年,并一直将其视为发表顶级数据科学文章的出版物。现在作为一个在这里定期发表文章的作者,我在我的数据技能和讲故事能力方面感到更加自信。而且每一次点赞和评论都是一种美好的认可形式。

  • 它增强了我的知识和技能。写文章的过程就像重新学习某样东西或重新经历一次旅程。它需要大量的事实核查和反思。因此,我写的每一篇文章都加强了我对主题的理解。

  • 这帮助我保持阅读和写作的习惯。用第二语言工作并不容易(我的母语是普通话)而且定期阅读和写作是不断提高我的英语沟通能力的关键。因为现在我在 Medium 上写作,我也倾向于其他人的文章以获取灵感。这形成了一个积极的阅读和写作循环。


用数据映射我的旅程

作为一名数据科学家,我喜欢收集和分析数据以改善决策。这也适用于博客写作。让我们从我的 Medium 之旅的一些关键指标开始(截至 11/3):

  • 发布的文章数:18

  • 总阅读量:54k

  • 总点赞数:6,926(每篇文章约 385 个)

  • 总粉丝数:3,210

  • 总收入:$2,140

这些只是主要指标。为了深入了解,我根据这篇指南准备了一个数据集,其中包括每篇文章的每日浏览量、阅读量、点赞数、关注数和收入统计数据。以下是我在探索性数据分析中发现的内容。

关键数据洞察

1. 80%的文章浏览发生在前 7 天内。

如下面的图表所示,平均而言,50%的浏览量在发布后的前 3 天内产生,80%在发布后的前 7 天内产生。两周后,每日浏览量通常会低于 50。这可能是由于 1.像 Towards Data Science 这样的出版物通常在发布后的前几天内在社交媒体上分享新文章,2. Medium 在通过其推荐系统分发文章时优先考虑较新的文章。

这意味着您可以在 3 天内就已经知道您的文章是否受欢迎。

https://github.com/OpenDocCN/towardsdatascience-blog-zh-2024/raw/master/docs/img/5c3e20f20902d39a49cf255f19504ace.pnghttps://github.com/OpenDocCN/towardsdatascience-blog-zh-2024/raw/master/docs/img/355b89c7b062c6c681e9a70a9a7714c8.png

每日浏览量可视化、数据和图像由作者提供

2. 中等会员比非会员更有可能阅读文章,概率是 3 倍。

Medium 将浏览量定义为访问您故事页面的用户,而阅读量则定义为阅读您的文章至少 30 秒的用户。因此,阅读率 = 阅读量 / 浏览量可以告诉您您的文章对访问者的吸引力。

我注意到的一个有趣模式是,中等会员的阅读率大约为 60%,而非会员的阅读率则接近 20%。这表明,当您支付订阅费时,您更有动力内容。同时,这也可能是由非会员在达到每月预览限制后(如果这些浏览量不包括在 Medium 的统计数据中,这一点我无法验证)会遇到付费墙的事实所驱动的。

https://github.com/OpenDocCN/towardsdatascience-blog-zh-2024/raw/master/docs/img/aaca73cf07ec25ffb45fc3bcffef3b2e.png

会员与非会员阅读率对比,数据和图像由作者提供

**3. 文章收入遵循 80/20 法则。**我的 80%的收入来自仅仅 3 篇文章,这是 80/20 法则的一个完美例子。事实上,我的表现最好的文章现在已经为我带来了近 1000 美元。另一方面,如下面的直方图所示,许多文章的收入低于 10 美元。

我表现最好的三篇文章也恰好是 Medium 提升的三篇文章。"提升"是一个 Medium 精选高质量故事并通过对推荐算法进行加权以进行额外分发的计划。根据 Medium 的说法,“95%的推荐故事在两周内至少获得 500 次额外浏览”。您可以在此处了解更多关于此计划的信息。

https://github.com/OpenDocCN/towardsdatascience-blog-zh-2024/raw/master/docs/img/33a8e41f64a98323af0113c7464f29c7.png

文章收入直方图,数据和图像由作者提供

4. 会员的阅读量和是否被提升是收入的关键。

那么,哪些因素决定了收益?Medium 从未透露其公式,但在其帮助中心文章中分享了一些关键因素。其帮助中心文章。以下是我通过分析我的(小样本)收益数据得出的看法。影响收益的最主要两个因素是:

  1. 如果你的文章是否被提升。在帮助文章中,Medium 还提到,“当故事被提升时,存在“参与度点的乘数”。正如你可以在我的下图中看到的那样,提升文章的收益明显高于非提升文章。

  2. 成员阅读量。你从 Medium 成员那里获得的阅读量越多,你的收益就会越高。当我将提升与非提升文章分开时,我发现成员阅读量与收益之间存在强烈的正相关关系。请注意,这是成员阅读量——不幸的是,根据帮助文章,非成员的阅读量并不重要。

https://github.com/OpenDocCN/towardsdatascience-blog-zh-2024/raw/master/docs/img/550099f36458af1cf2436ef34b125671.png

成员阅读量、提升和收益之间的相关性,数据和图像由作者提供

下面是拟合的回归公式:

  1. 提升文章:收益 = 0.28 * 成员阅读量 - 43

    • R-squared = 0.998

    • P-value = 0.029

    • 但请注意,我只有 3 个数据点哈哈!

  2. 未提升的文章:收益 = 0.027 * 成员阅读量 + 2.1

    • R-squared = 0.965

    • P-value = <0.001

    • 样本量 = 15

提升文章的斜率是非提升文章的 10 倍。换句话说,当你的文章被提升时,你将获得 10 倍的收益💰 。

Medium 表示阅读时间和参与度,如点赞、高亮和回复,也会影响收益。然而,我的文章大多在 7 到 10 分钟之间,所以阅读时间可能变化不大(而且数据对我来说不可用)。至于参与度指标,它们似乎都与成员阅读量高度相关。因此,仅使用成员阅读量本身在我的情况下就已经具有很强的预测力。

最终,当我有一天获得一个显著更大的数据集时,我计划使用我所拥有的所有指标进行更严格的回归分析。但请告诉我,我的发现是否与你的 Medium 文章统计数据相符哦 🙂


数据驱动的 Medium 写作策略

我们可以从上述分析中学到什么?以下是我对 Medium 写作的数据驱动建议:

  1. 定期写作以建立你的读者群:收益与成员阅读量高度相关。如何增加成员阅读量?那就是建立你的读者群。每篇文章都有机会吸引更多粉丝,如果你的文章经常出现在某人的主页上,他们更有可能关注你并阅读你的未来文章。

  2. 质量胜于数量:我看到有人推荐每天发布文章。但我的意思并不是说经常写作。我相信完全打磨一个你真正感兴趣的主题的文章是吸引你的受众并提高阅读率的方法。这也增加了你获得“提升”的机会。(坦白说,我并不是那种每天都能想出新写作想法的创意人士…)

  3. 投稿给出版物。像 Towards Data Science 这样的出版物已经建立了他们的订阅者基础,并将接受的文章通过电子邮件、LinkedIn 帖子、Twitter(我的意思是… X)等各个渠道分发。这意味着你的文章将比仅仅让 Medium 进行推荐算法魔法或在你社交媒体上分享时接触到更广泛的受众。这对新作家来说尤其重要。此外,只有出版物编辑才能提名你的文章参加“提升”计划(了解更多这里)。这也给了你更高的机会赚取更多收入。

  4. 优化你的标题和开头。当有人至少阅读你的故事 30 秒时,就会有一个“阅读”计数。在 30 秒内人们能看到什么?那可能只有足够的时间阅读标题和副标题,以及快速浏览第一段。因此,你应该尝试优化第一印象以吸引读者的兴趣。这也是为什么公司会进行 SEO 和营销邮件优化。如果我能对我的标题进行 A/B 测试,那会很好,但不幸的是,在 Medium 上这是做不到的。所以我现在也在通过试错来学习。

  5. 创建属于你自己的内容。在我过去的文章中,表现最好的总是那些带有更多个人特色的文章。即使是像 SQL 优化这样的技术主题,我也加入了我的个人经验和例子。本质上,你的内容不应该是 ChatGPT 能够自己创造的东西。


希望这篇文章能让你对在 Medium 上写作(尤其是在数据科学领域)有更多的了解,并激励你开始类似的旅程。

如果你喜欢这篇文章,请关注我并查看我在数据科学、分析和 AI 方面的其他文章。 🙂

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/3/4 21:48:55

造相 Z-Image 开源大模型实践:24GB显存GPU上实现商业级图像生成

造相 Z-Image 开源大模型实践&#xff1a;24GB显存GPU上实现商业级图像生成 1. 为什么在24GB显卡上跑文生图&#xff0c;不再是妥协而是最优解&#xff1f; 很多人第一次听说“在RTX 4090D&#xff08;24GB显存&#xff09;上跑文生图”&#xff0c;第一反应是&#xff1a;这…

作者头像 李华
网站建设 2026/2/25 12:08:40

2024网页内容访问实用指南:从限制诊断到合规解决方案

#2024网页内容访问实用指南&#xff1a;从限制诊断到合规解决方案 【免费下载链接】bypass-paywalls-chrome-clean 项目地址: https://gitcode.com/GitHub_Trending/by/bypass-paywalls-chrome-clean 在信息获取日益重要的今天&#xff0c;网页访问限制已成为获取优质内…

作者头像 李华
网站建设 2026/3/5 3:51:19

LangChain在深度学习训练中的应用:知识增强模型开发

LangChain在深度学习训练中的应用&#xff1a;知识增强模型开发 1. 当传统训练流程遇到知识瓶颈 最近帮一个做医疗影像分析的团队优化模型时&#xff0c;他们提了个让我思考很久的问题&#xff1a;“为什么我们花了三个月收集标注数据、调参训练&#xff0c;模型在新医院的数…

作者头像 李华
网站建设 2026/2/26 5:41:36

Qwen3-ASR-1.7B保姆级教程:5GB显存适配与GPU利用率优化技巧

Qwen3-ASR-1.7B保姆级教程&#xff1a;5GB显存适配与GPU利用率优化技巧 你是否遇到过这样的问题&#xff1a;想跑一个高精度语音识别模型&#xff0c;却发现显存不够、GPU跑不满、识别卡顿还报错&#xff1f;Qwen3-ASR-1.7B 是阿里云通义千问团队推出的开源语音识别模型&#…

作者头像 李华