熊言熊语

思考问题的熊

马上订阅 熊言熊语 RSS 更新: https://kaopubear.top/blog/atom.xml

熊言熊语会员通讯 4321X 第5期

2021年2月2日 20:04

你现在看到的是熊言熊语会员通讯 4321X 的第 5 期试读版本,今后我们会不定期的将部分会员通讯内容发布到公开平台,如果想稳定的阅读每期内容欢迎通过邮件订阅这份免费的会员通讯服务。

Hi, 见信好:

我是思考问题的熊,你现在正在阅读的是熊言熊语会员通讯「4321X」第 5 期。

截至本期通讯,「4321X」订阅人数为:529。

刊首语

上一期会员通讯聊到了确定性和不确定性问题,我提到希望这封会员通讯可以给你在充满不确定性的生活中带来一些确定感。But,如你所见,这一期还是没能在确定的时间和你见面。

我发现自己陷入了一点迷思,这期刊首语就聊聊关于预期和输出的困惑吧。

在第 0 期介绍这份邮件通讯的时候,我提到过「4321X」名字的来历:在每期通讯中推荐 4 篇生物信息/医学相关文献,分享 3 个过去一段时间的思考,推荐 2 个喜欢的工具,同时提出 1 个问题供交流,而 X 则代表不固定的 one more thing。

实际操作下来这几期,我发现在一个固定的时间段内凑齐 4+3+2+1 这 10 个内容还真不容易。本以为按照自己的素材储备和阅读量,一周找出 4 篇文献,浮现出 3 个思考这些硬性指标问题不大,但常常陷入 4 缺 2 或者 3 缺 1 的尴尬局面。比如本期内容 5 天以前已经是 2+3+2+1 的状态,但为了完成 4 篇文献的指标一直拖着没有推送。

所以困惑之一是写作的终极问题,应该面向自己还是面向读者写作呢。

如果写博客,我的观点一定是面向自己写作,这些文章写出来是等着被发现,大家通过搜索带着明确的目的找到你写的文章,所以不需要考虑其他人是不是感兴趣,关键在于把想写的东西写清楚,带着目的来的人看完不会太失望即可。但 newsletter 这种形式是一种主动出击,你明确的知道它会被一部分看到,愿意把邮箱告诉你的人一定会对接受到的内容带有信任感和期待,这时就难免会想我写的内容他看到感不感兴趣。

困惑之二是预期管理时,时间上的确定性重要还是内容的确定性更重要。

作为这份通讯的订阅读者,如果二选一你更在意哪一个呢?是希望每周固定的时间都可以看到一封邮件,还是希望打开邮件看到的一定是 4+3+2+1 足量内容。可能你当然是希望看到固定时间且足量的内容,但这又回到了开头写到的,在一个固定的时间里我就是没有找到那么多愿意分享给你的内容。这个时候该怎么选择呢?我作为读者的感受是更希望看到定时推送,至于内容篇幅没什么执念。

亦或者,作为读者这两者你都不在意,而是更希望时不时能通过「熊言熊语」公众号或者我们 Telegram 的「熊言熊语」频道看到一些短篇幅高频率的分享?因为我最近有在梳理 2021 年的分享方式和渠道,希望你可以回复这封邮件或者直接写信告诉我一些你的想法,邮箱是 hi@kaopubear.top

困惑之三是关于输出的意义。

在我关注的很多作者中,发现极少有人能够长期稳定且高质量的输出,如果不是不得不做,坚持的确是太难了。这就带来了一个悖论:所有决定 follow 你的人其实都是基于之前的内容,但从他(她)开始关注你的那一刻起在乎的又只是你以后的内容。所以,输出这件事一旦停下来就等于前功尽弃,留下的最多剩下一个念想。读的人可能来来往往,写的人必须一直向前。不过,能够坚持下来的少数人会逐渐积累输出带来的复利,随着时间推移看到越来越大的变化。我们现在做的每一件事,都是在为今后某一刻作准备。

抱着这些困惑,我咨询了丁香园的产品经理少楠,他同时还经营着一个已经 4 年之久的付费邮件通讯,也是想法记录工具 flomo 的开发者(我们曾经在第 0 期会员通讯有过推荐)。他的建议是适当减少数量且不要限制主题,但是要保证质量和持续更新。嗯,我觉得他说的对,所以以后「4321X」偶尔货不对板你也不要太惊讶,保证东西都是好东西,更重要的是要时常见面才好。

文献

Accurate and efficient detection of gene fusions from RNA sequencing data

We developed Arriba, a novel fusion detection algorithm with high sensitivity and short runtime. These results demonstrate Arriba's utility in both basic cancer research and clinical translation.

DOI: https://doi.org/10.1101/gr.257246.119

基因融合与各种疾病特别是癌症的发生发展紧密相关,甚至是一些癌症的直接诱因, 检测基因融合这件事很重要,但也已经有了很多分析方案。最近发表在 Genome Research 的这篇文章强调,他们推出的命令行工具专门为了临床研究而开发,特点是那叫一个快和那叫一个准。使用 STAR 比对后的结果进行后续分析只需要 2 分钟左右就能得到结果,而且准度更好。如果你有这个需求可以测试一下。这个软件还是 DREAM SMC-RNA 挑战赛的冠军,这个比赛由 ICGC、 TCGA、 IBM 和 Sage Bionetworks 联合组织,目的是确定当前从 RNA-Seq 数据中检测基因融合的黄金标准。

IGD: high-performance search for large-scale genomic interval datasets

we introduce the integrated genome database (IGD), a method and tool for searching genome interval datasets more than three orders of magnitude faster than existing approaches, while using only one hundredth of the memory.

DOI:https://doi.org/10/ghmqdt

会员通讯第 1 期我曾经谈过自己对于生物信息打工人的理解,其中很大一部分日常就是找各种基因组区间的交并集。bedtools 是最常用的工具,但它对极大数据集就不灵了。因此,2018 年针对超大数据集的工具 Giggle...

剩余内容已隐藏

查看完整文章以阅读更多