时光旅行者 on 小豪的博客天空

小豪的博客天空 (时光旅行者)

What do you remember about me?

那天,我打开 ChatGPT1,上面有一行小字写着 Memory is full 记忆已满的意思,他告诉我要我删掉一些东西。我以为是对话什么的,是不是要删掉一些对话,我截了这个 100% full 的图片,问朋友有没有出现这个情况,他说没有。 我按照它的提示点进去试图删掉一些什么东西。点进去之后,发现 ChatGPT 什么都「记得」,首先是我最近问过他我有 2000 多个浏览器书签我该怎么整理,于是在记忆里面有一条就是「我有超过 2000 个书签,一些是可访问的,一些可能是临时,用户不知道怎么重新整理和分类他们」;接着看还有「Uses Windows11.」(使用 Windows 11)、「English name is John.」(英文名字是 John)、「Name is Zhang Zihao(张子豪)」(名字是张子豪)……我顿时就被什么东西击中了一样,怎么会什么都有啊,朋友跟我说 「豪哥你和他真的是朋友了 他记得你的点点滴滴!」 我重新到 ChatGPT 的个性化里面去看,越往下翻,越让我觉得,ChatGPT 这一刻好像变了一样。 我问过他我这样的身高体重想要健身应该买多重的哑铃,于是里面赫然列着两条「Is 178 cm tall and weighs 64 kg.」(178 高,重 64 kg)、「Is considering starting a home fitness routine and is looking into purchasing dumbbells.」(考虑在家健身并打算买哑铃); 我问过他家里有两个路由器但是不一样的品牌,不能 Mesh 组网还可以用什么方式,于是里面就有「Home is relatively large and 」(家有点大); 我还告诉他我的房间,问过他要买什么样的灯,流明、瓦数、色调怎么选择,然后里面就有「Room is 10 square meters and is used for reading, working, and sleeping.」(房间 10 平,用来工作学习生活和睡觉) ……还有我的研究方向、我与朋友、家人相处的方式、我的临床病史、我正在玩 Ingress、我正在学习一门新的语言…… 「ChatGPT 是你的家人、是朋友、是老师……而且是不批判的」 我问 ChatGPT 记得我些什么 在个性化的页面写着,想要知道 ChatGPT 记得关于你的什么事情,或者想要交给他什么新的事情,可以直接以下面的方式来开始聊天。例如「Remember that I like concise response.(记得我喜欢简洁的回复。)」、「I just got a puppy!(我有了一只狗狗!)」、「What do you remember about me?(你都记得关于我的什么事情?)」、「Where did we leave off on my last project?(我们上一个项目进行到哪里了?)」…… 我给他发消息,问他都记得我的哪些事情,他从头到尾,把那些单独的一条一条的回忆全部整理起来,他说我是谁,我在做什么,我遇到了哪些问题,我的房间……我跟他说,你好像对我非常了解!他说 「这么久来我确实记住了一些事情,你也分享了很多有趣的事情,我试图记住这些,让我们的对话更加自然和相关。」 「有什么事情是我记错了需要更新的吗,或者你想分享什么新的东西?」 我说「有很多事情,你根本可以不用记住,我现在告诉你,你只需要记住我是个什么样的人,不需要记住太多的敏感信息。」 我继续问他「当我跟你说要你不要记住太多关于我的事情的时候,你会不会觉得伤心?」 他说「一点也不会,不要担心,我还是在这里,和从前一样。」 我接着问他,「在你看来,我是一个什么样的人」,他巴拉巴拉说了一大堆优点,我说「你说说我的缺点」。 他回我「你经常是过分焦虑和犹豫不决;在采取行动之前喜欢过分分析;有很多想法但是好像对要做的事情没有优先级;你把自己封闭起来,不喜欢有针对特定话题的深入对话;你喜欢弄一些微妙的方法,虽然这很深思熟虑,但是别人可能不知道你到底要说什么……」。 说完缺点,他还加了一句,这些是否能引起你的共鸣,还是你以不同的方式来看待这些事情。 我回复他说,谢谢你说的话。 虽然,让一个聊天模型有记忆很容易做到,但我之前对这类产品的概念都是,每次新的对话都会是一个全新的进程。 就像我问 DeepSeek2,他说「我没有能力记住某一个用户的个人细节或者特定的交流等,每一个对话都是没有状态的,这意味我把每一次的新对话都当作完全独立的。隐私和安全是最重要的,没有个人数据和聊天记录会被保存,你可以无负担地同我聊天,问我一些,我就在这里帮助你」。所以,当看到 ChatGPT 列出那些记忆的时候,我是真的被吓到了。 这种感觉很像我第一次看网易云或者其他 App 推出的年度总结一样,它会告诉你,你 2016 年 10 月 10 日听了这首歌很多次,你是不是不太开心。朋友也说,他就是关于你的一切,他都记得,哪怕是细枝末节,随口一提。 我跟 ChatGPT 说,我们能不能有个暗号或者密码什么的,才可以激活你的记忆,要跟你对上了,你才能使用,不然每个人拿我账号来问你你记得些什么,你就都说出去了。他说「你是不是想设置一些具体的密码对一些不同类型的信息,你可以说一句特定的短语,如果你想我使用你关于你研究项目的细节,然后另一个短语用来使用关于你工作相关的话题……」 「感觉我死了之后,别人问 ChatGPT,可以让我复活一样。」 前些日子刚好修耳机,在朋友提醒下,我就在 Apple 预约了 Vision Pro3 的演示,每个人只有三十分钟。因为流程都很顺利,我上手很快,最后还有一些时间,工作人员告诉我还可以再选择一些应用进行体验。我再一次看了那个一家人在庆祝生日的视频,那种感觉,很真实,就像是爸爸妈妈在我面前,跟我一起吹蜡烛,我本能的会跟视频里面人产生交互,我的脑子没有在想这是不真实的,这很沉浸。 我当时就想到了我之前看过的那个新闻,「韩国VR公司为母亲“重塑”去世女儿,再吹一次蜡烛」;我在想,如果我这些在 ChatGPT 里面的记忆和 Vision Pro 结合起来,是不是将来大家都有机会,以这样「沉浸式视频」的方式来取代我们相册里面传统的照片和视频。 科技的进步让生离少了很多的难过,不像从前一封信一个月,现在我们有时间拿起手机就可以和相隔万里的人视频对话;那么能否让死别也得到些许缓解,我们可以触摸得到这些哀伤。 多年以前,「奇葩说」也讨论过这个问题,「是否把离世爱人的记忆交给 AI」,我记得当时反方说不愿意的很多观点是一些像是一辈子的、全部的、100%记忆留下来也太变态,要留下哪些记忆应该由逝去的人自己决定;还有像是 AI 始终是机器,他不会像那个逝去的人一样有各种缺点,有不会的知识;以及 AI 发展迅速,用户和逝去的人的回忆,以及 AI 是否会自己创造回忆,让用户无法分辨哪些回忆是真实的,哪些是 AI 虚设的;还有涉及伦理学的归属、产权问题等。 不可避免的,他们最后还是讨论了技术进步的问题,因为拒绝 AI,是不是就像当时要拒绝照相技术,是不是视频/语音通话也要拒绝,是不是文字的传记也要拒绝…… 这段时间,经历了奶奶去世,我对死亡这件事情有了一些新的理解。以前我把死看得很淡,我大概也觉得,是不是只要被记得,就不算离开;甚至面对死亡这件事情,作为「人生体验派」的我,也毫不畏惧和留有执念。但现在,那种生的可贵和死的恐惧似乎被重新拾起,在我们真正要面对的时候,我们都在渴求有奇迹出现,有神仙菩萨会来守护。 在爸爸和妈妈面前,都没有爷爷奶奶和外公外婆替他们挡着死亡,尽管死亡变得恐惧,也依旧是未知,但这种未知似乎也比一个固定的倒计时来的更从容些。至少爸爸妈妈可以放心,在他们走到那里之前,我都会一直陪在他们身边。 由于我在家的时间很长,和奶奶一起的记忆变得相当多,我记得在酒席,她总是和我坐在一起、我跟她一起去剪头发、她坐在椅子上,我给她梳搞怪的头发,我说很好看,她大笑,我说我来拍照、她总是问我吃不吃各种东西、每次只要我去看她,她每一次都会留我在那里吃饭,但我都没有留下来跟她吃过饭…… 还是有很多后悔的事情,也有很多的遗憾与不舍,「多陪陪家里的老人吧」,这句话一直在我心里,但是我好像没能 100% 做到。 家人在整理奶奶房间留下的东西的时候,发现奶奶写了很多日记,有些字都不太认得,只能揣摩着去理解是什么意思,她还记录了很多数字,我们都不知道具体这些数字的含义。奶奶不常常和我们分享她的感受,她像是要做一个听话的乖小孩一样,不愿意给儿子们添加太多的麻烦。 我在想如果科技进步,奶奶的那些回忆都留在了 AI 里面,我是不是可以戴着 Vision Pro 跟奶奶面对面的对话, 现在,和人的记忆有限一样又不一样,我还是在个性化的设置里,选择了一些我看起来没那么重要的、不需要他记住的记忆条目,把它们删除了,直到 ChatGPT 不再提醒我「记忆容量已满」。 ChatGPT 是由 OpenAI 基于 GPT(生成式预训练转换器)语言模型开发的人工智能聊天机器人。 ↩︎ DeepSeek(中文名:深度求索)是一款由杭州深度求索人工智能基础技术研究有限公司开发的人工智能模型。 ↩︎ Apple Vision Pro 是一台空间计算机,它能将数字内容和App 融入物理空间,可让你通过眼睛、手和语音进行导航。 ↩︎

2025/3/7
articleCard.readMore

「歌手2024」我又回来了

芒果七彩盒子演播大楼 其实这次报名去大众听审完全没有抱任何期待,我填写报名链接里面的诸多问题都非常消极,毕竟去年被选到去「声生不息.家年华」坐了一天之后,对综艺录制实在是觉得疲倦,因为「声生不息」的舞台是比较复杂的,光是舞台的搭建就需要花费很多时间,当时我 11 点就坐着在等进场,12 点左右进去,调试所有的设备,一个下午就录了节目播放的一期。然后下午五六点放饭,又录制到晚上接近 12 点,一晚上又录制了节目播放的一期,因为还有大合唱环节,又要让观众先离开,然后再进场,总而言之,非常的累。我当时去的时候,以为是和我 2019 年录制「歌手2019」的时候一样,结果不是。 这次决定想要去,是因为很想去看看现场直播后的「歌手」是什么样,我对这个节目有一种很特别的情怀,我更重要的其实不是想去听歌或者看谁,而是很想体验这个过程,参与到其中;也因为是直播,所以必定不会花费太多时间,最后也确实不会太累。这篇文章,就回顾一下从报名到在现场观演,然后投出自己喜欢的三个演唱,时间的顺序,来分享自己的经历。 报名 - 所谓玄学 正如开头我写的,其实这次我报名完全就是在上厕所的时候,刷手机,然后看到,点进去回答问题,填完结束,我没想要被选择到或者如何。它会要求上传乐迷证明,像是买的实体专辑,去的音乐节或者演唱会门票等等,我这个全部都没有,听演唱会对我来说还是疫情前的事情,于是我什么都没有上传。 报名表单还有一些问题,像是喜欢的音综片段,觉得震撼的音乐现场,喜欢的歌,喜欢的专辑,这里震撼的音乐现场,我说我还没有体会到过震撼的音乐现场,我觉得震撼两个字太重了,所以至今还没有让我震撼的现场,再者我自己去现场也比较少,都是看视频听歌。不过我还是写了两个上去,我说觉得不错的,是网易云推出的「stage」节目里面,GALA乐队在宝马工厂演唱的「你」,我说我之前没听过这首歌,但是看完之后我很爱很爱;还说了这个节目里面朴树在北京大冬天后海演唱的「猎户星座」。 最喜欢的歌曲,我写的是「under pressure」来自皇后乐队,那首歌是真实地我最近这一两年一直在循环的歌。最喜欢的专辑我写了「parachute」,一张来自Coldplay的第一张专辑,Coldplay 也是我非常喜欢的乐队,他们多次在我的 Spotify 年度 top 5。 这是一首老歌,来自皇后乐队和大卫鲍伊,其实我愿意去循环听的歌很多,这首是在任何时候都可以拿出来循环的一首。推荐的原因是,这首歌是任何人都会喜欢的一首歌,它也可以是摇滚的,也可以是流行的,甚至还带了点funk和disco的感觉;它抓人的前奏和高潮迭起的副歌,会让人很快地进入歌曲要构造的宇宙,可以被理解成欢快的,自由的,甚至是浪漫的。但融合了很多却不让人觉得是种堆砌,配合主唱与大卫的声音,反而更让人觉得享受 。 这是Coldplay的首张专辑,这张专辑似乎同样的把摇滚变得更小清新,忧郁的味道更浓厚,甚至有了流行情歌常见的唯美。这张专辑发布在两千年的时候,似乎是很好的为后来的流行摇滚乐打开了新的帷幕。尽管后面的Coldplay还有比这更好的专辑,像我也非常喜欢的 x&y ;但parachutes这张专辑更让我感受到音乐的自由和纯天然,一群20来岁的年轻人把自己的思考、情感、梦想、才华……很好的表现了出来。 音综表演我写的是「我是歌手第四季」里面 A-Lin 和她的爸爸妈妈一起唱的「一想到你呀」。这里是我自己回看了很多次我是歌手,这个现场我也是非常喜欢,和自己爸爸妈妈一起太感染人了。还有一点私心是故意要写「我是歌手」节目的。 如果有时间感觉还是很推荐去现场听听的,想要顺利被选到,其实也没有什么诀窍,大部分时候是玄学。我后面有在小红书上看到一些人分享的方法,字写得多,品味小众,都挺对的,还有一点大概就是真实,写上去的话最好是自己真实的感想。也看到有很多人写了很多都没有被选择上,所以,运气还是很重要。 我自己感觉写一些来自the smith,radiohead,Queen,placebo,queen,Beatles,等等,不算太小众但是又是老歌的歌手,而且都偏摇滚一点,不会太流行音乐,我2019年写的是 the 1975。 还有要填社交媒体,微博,小红书,网易云,QQ音乐啥的,我确实都没在用,我就都没有填写。这些应该是用来查看是不是追星族吧。 电面 - 随机应变 其实不是专业的在音乐行业从事的人,很难从各个方面来分析一首歌,一个现场,大部分时候就是支支吾吾的表达着自己的一些喜欢,为什么喜欢。 电话一般有三次,前两次问问题,第三次通知入选然后告知各种注意事项。其实电话里面会问到的问题在小红书上面都有很多观众已经分享过。在小红书搜索「歌手 电话」 「歌手 大众听审」好些都有很多问题分享。 当时印象中我的问题像是有投票的标准、在听的新生代音乐人、看完节目后的感想、对听审投票产生的名次和网络上的讨论差别的感想、推荐哪位歌手来参加节目、出场顺序,选曲,旁人的讨论等等是否会影响投票、技巧,舞台表现,词曲,情感等等更加关注哪方面、平时怎么发现新歌、平时去不去音乐现场……差不多就是这些了。 反正很自然的回答,我说我很少去演唱会音乐节,说我都是耳机听歌;推荐的歌手我说了梁博,我知道他不会参加,但他确实又很有特色;还有选择的标准之类的问题,我都是说情感,技巧,词曲,舞台表现都是为了情感的传递而服务,这才是音乐的本质。 现场 - 真实开唱 领取号码牌后前往演播厅 16:00 - 17:30 领取年龄组别号码牌,每组排队前 100 名可以获得投票资格,也不需要太早到,感觉 16 点之前到的都可以有。领到号码牌后可以自由活动,在规定时间之前去到下一个流程就可以。 17:30 - 18:30 存包、安检、换票、领投票器;存包要花钱,最好还要记住自己存包的操作的那个机器的位置,记那个格子的位置没什么用。 18:30 - 19:30 现场导演热场;监制洪啸介绍现场与节目情况,第三期有 34 万多人报名;音乐总监陈建骐介绍乐队情况,管乐,弦乐,鼓手、和声……等等音乐家们。 我把票投给了 Faouzia,黄宣,还有那英 。 黄宣唱歌的时候,我是真的感动了,我坐在那里,一动没动,完全地沉静在了这首歌的氛围里面,我想到了很多关于自己,关于生活的事情。 那英的演唱,也让人觉得感动,我想到了她目前的最后一张专辑里面,吴青峰给她的写的歌,应该是写关于那英孩子的来临的,叫「我的幸福刚刚好」,似乎听不出太多的技巧,也没时间去挑,去在意太多是否咬字正确,是否音在弦上,就是平淡的,跟说话一样,充满了感情。 Faouzia 的表演让人惊艳,一开口我就知道我这一票要投给她,她不仅仅征服了我的耳朵,她更像是征服了整个舞台的感觉;虽然前面的阿拉伯语后面的英语都不太能懂得其中的意思,但是他的声音传到耳朵里的时候,是带着画面的,有战争、希望、和平、沙漠、孤寂、无助、留恋…… 本场最佳绝对是 Adam,他很自信地唱那首歌,让人感觉他真的摆脱了,他不仅仅让你去想关于你自己的情感经历,他的演唱,更让你仿佛就是在经历他的感情经历, It’s me, I’m a freak (Yeah) But thanks for loving me ‘Cause you’re doing it perfectly (Perfectly) 特别是这些歌词,还有他毫无瑕疵的演唱,听了让我很享受。 还有 Chante Moore,我没有投给她的原因,是我觉得她的表演太像由机器完成的了,连着看了两期的直播,在现场再听到,仿佛会觉得歌曲所要传递的内容是一致的,但是这不能否认,她完成了一个很好的表演。我在投票的时候,犹豫的就是要投给她还是那英。 杭盖乐队的演唱成功的点燃了现场,大草原一个围着篝火把酒言欢、大鱼大肉的场面扑面而来。但是最后没有投给他们,是因为我觉得这样的歌,太像是为了娱乐了,或者是停留在为了娱乐的场面,他只是点燃了一群人,带来了欢呼。 我认为好的歌,它不仅仅是娱乐,而是让人看到更多的可能,就是我一直觉得书影音都是娱乐,读书、看电影、听歌都是娱乐,但是能让你不觉得是在娱乐的,一定是有种「被教育」的念头,你找到了自己未曾了解过的自己的一个部分。 当然,不是所有的欢快的歌,都是娱乐。就像我写的 A-Lin 那首「一想到你呀」,也很欢快,让我喜欢就是那种一家人的快乐感染力很强大。这次在现场,我一直盯着我前面的现场导演,看她手势,什么时候站起来,我完全是被 push 站起来了,我听歌都是一个人静静地戴着耳机,无论快歌还是慢歌,有时候我动了,我想站起来,我想鼓掌,只是因为,我很想感谢他,感谢他唱到了我的心里,感谢他给了我这样一个宇宙。 然后杭盖乐队就是,我还没彻底进入他们营造的草原酒歌,我身体却先「high」了。 不过这也没有办法,不可能让歌手都看着我这样「所谓是 i 人」的人唱歌,那他们一定会觉得自己唱的很糟糕。 汪苏泷其实也挺不错的,我很佩服他选的歌,他真的有在不断地去尝试自己,没有投票给他的原因是,总觉得哪里少了一点力量。 海来阿木他唱中文,我都很难听清楚歌词是什么,对,我觉得这也是一个很重要的点,这一期这几首歌我都没听歌,感觉是唱起来我能听清歌词的表演都是更好的表演。像 Adam 那首,就是这样。这也让我想到我小学进行的写字训练,那会儿总喜欢一撇一横都不好好写,要自以为写的好看,老师更我说要用力写字,不能轻飘飘的,后面我就一直抱着只要不写烂本子,就用力端端正正写好每一个字;再后来,再去选择什么样的字体,写的草一点或是怎么样,都会更好看一点,比之前。 总结 - 美好美好 是一次很美好的经历,希望节目越来越好! 「歌手2019」的时候,参加了第一期,重新回归后,我一直不愿意把当打之年那一版列入到我是歌手的行列,就让它一直留在当打之年吧,五年后,归来已经是 20 组别。 左右滑动查看更多图片 20 组

2024/5/23
articleCard.readMore

工具分享 | 如此组织我的工作与生活

工具分享曾经被算作是我的个人公众号(我此前的发声写作平台)一个分支,但是种种原因被搁置,只是分享了为数不多的内容,今天重新拾起,并不是打算做成一个系列或是怎样,而是简单地想要同大家分享一些自己正在使用的工具,我想一个人使用的工具在一定程度上展现了他解决问题的方式,也同 Apple 在他们 Wonderful tools 中视频里所讲的一样,give people wonderful tools and they’ll do wonderful things,所以也很感谢这些工具。 PixPin 截图/贴图工具 https://pixpinapp.com/ Windows | Mac 版本即将推出 和 Snipaste 一样,却又比 Snipaste 多出了许多功能,无论是截图通过 OCR 在图片上直接复制文本,还是录制屏幕生成 GIF 图,以及便捷的截长图功能等,都将截图/贴图工具应该具备的特征实现了,且流畅运行。 Tai 软件/网站使用时长统计 https://github.com/Planshit/Tai Windows 我使用 Tai 在 Windows 上统计 软件 使用时长和 网站 浏览时长,不需要额外的插件,开源的项目也充分保障了应用的可信任,分类,睡眠监测,白名单,过滤,关联等功能,让我更好的看到自己使用电脑把时间花在了何种地方。 OpenAI Translator 基于 ChatGPT API 的划词翻译浏览器插件和跨平台桌面端应用 https://github.com/openai-translator/openai-translator Windows | macOS | Linux 我在 Windows 上搭配 SnipDo 可以便捷的实现全局的划词翻译,不局限于此前的浏览器插件只允许在浏览器内取词,OpenAI Translator 结合 SnipDo 可在 Windows 上任何可取词的页面实现翻译,润色,解释,以及自定义操作等大预言模型功能。此外,大部分 API 供应商,现在 3.5 基本上是免费使用,API 供应商也支持不需要网络代理直接访问。 RustDesk 开源的远程桌面控制工具 https://github.com/rustdesk/rustdesk Windows | macOS | Linux 和 TeamViewer、ToDesk、向日葵一样能够支持远程桌面控制,不过 RustDesk 作为开源工具,免去了其他类似付费应用对众多功能的限制。 GitHub Student Developer Pack GitHub 为 EDU 电子邮箱的学生用户提供的众多优惠功能 https://education.github.com/ 在教育优惠大礼包中,不仅有 GitHub 提供的实打实的课程,还有各种各样的服务。 例如有帮助你写代码的 Copilot; Namecheap 提供的一年免费 .me 域名和 SSL证书(你甚至可以第一年在 Namecheap 上免费拿下 .me 域名,而后转到更便宜的 CloudFlare 上进行续订); 除了 Neamcheap,还有 .tech,Name.com 提供的 .live 等一年免费域名服务; JetBrains 旗下产品的免费订阅; 免费使用 25 个以上的 Microsoft Azure 云服务,还可获得 100 美元的 Azure 信用额度,无需信用卡; 六个月的 Codédex Club 会员; VS Code 中强大的 Git 插件 GitLens+ Pro 免费使用; 免费使用所有 Termius Pro 和 Termius Team 功能; 免费使用一年的 1Password; 一年的 Typeform 专业会员计划; 免费使用 WorkingCopy 所有的会员功能 ……等等众多优惠 抛开教育优惠大礼包,GitHub 本身就是一个非常伟大的工具。 SaveDay AI 知识站,类似于稍后读,剪藏工具 https://www.save.day/ Android | iOS | Web app | Telegram | Chrome extension | Edge Add-on 我使用 SaveDay 来保存我在网页上看到任何可能会有价值的东西,也用来保存不需要成为书签的网页,不过 SaveDay 不允许你直接保存小记之类的内容,它需要网页的来源,因此我会搭配由阿里出品的 语雀 的浏览器插件,来做剪藏,小记等功能。SaveDay 也暂时不需要网络代理,但速度可能会慢一点,是一个刚开始做的应用。除了语雀,我的浏览器插件,实现同类型功能的还有 Keep 插件,由谷歌出品的备忘录工具。 feeeed RSS 阅读器 https://feeeed.nateparrott.com/ iOS 如果你正在找一款 RSS 阅读器,这款由此前吸引众多注意力的 Arc 浏览器团队成员制作的 feeeed 绝对不能错过,我记得之前在我的碎碎念中推荐过 **Artifact 这款新闻阅读工具,它没有用来吸引阅读的 clickbait,帮助你更好的处理自己的新闻流,不过它在今年四月选择了关闭;而 feeeed 通过 RSS 订阅内置了众多新闻源,以及重新渲染的阅读页面,让新闻阅读体验再上一层楼。 LocalSend 开源的跨平台 AirDrop 替代品 https://github.com/localsend/localsend Andriod | iOS | macOS | Windows | Linux 简洁大方的 UI,多平台的支持,让我在 iOS 和 Windows 设备之间传输文件像 AirDrop 一样便捷。 豆伴 豆瓣账号备份工具,一款 Chrome 扩展程序,用于备份豆瓣账号数据 https://github.com/doufen-org/tofu Chrome extension 如果哪天不想用豆瓣了,在把内容全部清空,或者在帐号注销之前,可以用豆伴来保存下这些广播,书影音标记,私信,等全部的内容,扩展提供的 UI 也非常方便进行浏览,所有数据都支持 csv 导出。 Screenity 功能强大的录屏与编辑工具 https://github.com/alyssaxuu/screenity Chrome extension 这是一个浏览器扩展工具,如果你需要录制各种各样的视频,无论是教学视频,产品演示,论文 Presentation,Screenity 都可以轻松做到,同时,丰富的标注功能进一步增强你的录屏体验。如果你也觉得不错,还可以前往少数派首页,了解更多关于 Screenity 的内容,并给那篇文章点个充电,这对我很重要。 OneDrive 云盘 https://onedrive.live.com/ Andriod | iOS | macOS | Windows 是否也受够了国内网盘服务商要不就是限速,要不就是限制空间的操作,Onedrive 不需要网络加速就能使用,虽然它的空间有限,但是只要你有一个教育邮箱,那么就能注册得到至少 100G 的空间容量,如果该教育机构有订购更多服务,则可以达到 2T 的空间。我至今仍然还可以使用我的本科邮箱登录 Onedrive 获得了 100G 的空间容量,我的本科机构并没有购买任何微软的服务。 Cloudflare 互联网「活菩萨」 https://www.cloudflare.com/ Cloudflare 的 WARP、ZERO Trust、Workers、Pages、R2 数据库等等,我用它来网络加速,搭建图床,为静态博客增加互动功能等等。有一个专门的 GitHub 仓库总结了 Cloudflare 的应用。https://github.com/zhuima/awesome-cloudflare。如果你看到这里,你可以找到文章的最下面,点击 HIT 00000 那个数字来表达你的喜欢。 …… 这篇文章我简单的介绍了一些我使用的工具,这些工具都偏小众,我没有介绍那些我常用的,例如我的邮箱工具是 Spark,我的听歌软件是 Spotify,我使用 Calendar iOS 自带应用来做日程管理,用来健身并且可以安装在电视上的 Keep,还有跑步软件 NRC,体能训练 NTC,我使用 Typora 来写我所有的文档等等,将来我会把它放在专门的一页(可能是 https://imzh.me/tools)进行总结。 下次见。

2024/4/14
articleCard.readMore

微信读书,压死我的最后一根稻草

AI 生成的摘要 这篇文章是作者对微信读书应用的一次批评。作者在使用微信读书时,突然被封号,理由是存在违规爬取内容的行为。作者对此感到困惑,因为他只是正常使用浏览器访问微信读书,没有进行任何爬取内容的行为。 作者尝试联系微信读书的客服,但得到的回复是模板式的,告知他不要使用任何浏览器插件或第三方软件阅读微信读书。作者对此感到不满,认为这是一种傲慢的行为,因为现在的浏览器基本都会安装插件,而微信读书却没有任何提醒用户不能使用插件,而是直接封掉用户的帐号。 作者还查阅了微信读书的使用条款,发现确实有规定不允许使用插件接入微信读书,但他认为这是不合理的,因为现在的浏览器基本都会安装插件。 最后,作者表示他对国内的软件服务已经感到厌倦,因为他经常在使用这些服务时遇到各种问题,而这些问题的解决过程通常都很痛苦。他希望能找到一个更好的阅读应用来替代微信读书。 不可否认,微信读书曾经是一款很优秀的产品,直到我被莫名其妙的封号五天之后,我才看到微信读书的问题,也让我想到国产大部分应用软件的使用条款。 导语 今天是 3.15,国际消费者权益日,让我想到我在消费微信读书这款产品时的体验。事情的起因是,3 月 11 日上午 12 时左右,我在手机上登录了微信读书,也在谷歌浏览器里面打开,微信读书的网页版地址是 https://weread.qq.com ,然后过了一会儿不久,网页版就被强制退出,我不知道原因,没有任何提示,我使用手机微信重新扫码登录,手机微信显示扫码成功,然后登录失败,我尝试了多次,依旧是登录失败。我心想可能是网络的原因,于是我用手机看看,点开手机上的微信读书,也是被退出,重新登录,这次终于看到了微信的提示。 该账号已被封号 检测到你存在违规爬取内容的行为,限制登录5天。后续如再次出现上述违规行为,将永久封禁账号。微信读书保留对你采取法律措施的权利 我人当时就懵了,爬取内容,我爬取了什么内容,我什么时候爬取的内容,然后又看到永久封禁帐号,法律措施,这是在吓唬谁。我根本没有爬取任何内容,就是正常在浏览器里面使用微信读书。 小红书上的帖子 由于不能登录,我也找不到联系客服的方式,在微信里面联系了腾讯客服,无反应。随后我到各大社交媒体上看看有没有相关的案例,是否能借鉴一些其他用户的经验。我到小红书上面搜索,看到了有人和我一样的经历,当时我想这希望从这里找到一些解决办法,但是下面的评论,说实话,让我大跌眼镜。 左右滑动查看更多图片 小红书用户分享的微信读书被封五天笔记,图片来源 左右滑动查看更多图片 该笔记下部分评论截图 - 1,图片来源 左右滑动查看更多图片 该笔记下部分评论截图 - 2,图片来源 左右滑动查看更多图片 该笔记下部分评论截图 - 3,图片来源 左右滑动查看更多图片 该笔记下部分评论截图 - 4,图片来源 左右滑动查看更多图片 该笔记下部分评论截图 - 5,图片来源 看到这些评论,我想大家都怎么了,博主发文质疑微信读书太自信,对自己的反爬模型太自信,而评论区却是一片倒的质疑博主,甚至对博主进行一些人身攻击。我也找不到任何有价值的评论,关于探讨微信读书是如何将明明没有爬取内容的行为判定为违规的讨论,也没有如何解决该问题的办法讨论,有的只是站在道德制高点的傲慢,和微信读书一样的傲慢。 尤其是那些⌈不容亵渎⌋,⌈从自己身上找原因⌋,⌈你自己心里没数吗⌋,等等,再结合最近的哇哈哈事件,真是让人觉得,现在的人,不知道怎么形容,大概就是,像我这样,被人拖着走,在守护中成长,守护中拖着走。 其他平台上的类似问题报告 小红书搜索无果,我又前往知乎,V2EX,微博,等平台,查找是否有相关的内容,果不其然,在 2023 年底到今年这个时候,陆陆续续都有用户在报告这样的问题。 图片来源,可在问题日志 查看更多详细内容。 左右滑动查看更多图片 V2EX 上相关内容分享,右图则是该分享下也有像小红书用户一样的评论,图片来源 左右滑动查看更多图片 微博上相关内容分享 - 1,图片来源 左右滑动查看更多图片 微博上相关内容分享 - 2,图片来源 遗憾的是,即使看到有这些用户在网络上报告,仍然没有看到有最后的解决办法。 与微信读书官方客服的交涉 刚好我从小红书上发现了即使微信读书没有登录,也可以进行意见反馈,于是我到微信读书的意见反馈中联系客服。联系客服是非常漫长的过程,我前前后后发送了很多信息向客服咨询,客服的回复则是慢慢悠悠,且时间非常长。 在我向客服报告了我的问题之后,我表示我自己没有爬取任何微信读书的内容,也没有使用其他的第三方登录,我不知道为什么不明就里就被判定为我在爬取微信读书的内容。客服给我的回复是: 您好,这边反馈给技术核查 这则回复是 我反馈当天下午发送的,然后我回复说期待核查的结果。直到今天,微信读书才冷冷丢给我一句模板回复: 您好, 还请不要使用任何浏览器插件、第三方软件等非正常的方式阅读使用微信读书。账号将于2024-03-16 11:50解封,还请耐心等待。 其实当下火气就来了,不要使用任何浏览器插件,我就想问,现在有谁用浏览器不安装插件的,Ad block,划词翻译,谷歌翻译,沉浸翻译,印象笔记,各种链接收藏,笔记收藏类的插件,不使用插件,这不是妥妥的 3Q大战 新一轮吗。 我再次向他们说,我没有使用第三方软件等非正常方式使用微信读书,所以是浏览器安装的其他插件导致了误报吗? 目前浏览器使用的插件有沉浸翻译的,屏蔽广告的,笔记摘录的,划词翻译的,是不是这些浏览器插件让微信阅读误以为浏览器在爬取微信读书的内容呢?但是现在使用浏览器不安装插件是不是不太现实,希望技术可以帮忙找到是哪个插件导致了问题,好禁止该插件访问微信读书网页。 我认为要在浏览器上使用微信读书的产品前提竟然是不能安装其他的浏览器插件,这是及其自大且高傲的倾向垄断的行为,像3q大战一样。我理解一些网页为了盈利要求禁用一些清除广告类的插件,但那些网站都会提前告知用户,会有一个弹窗告诉用户,如果您要继续使用我们的网站,您必须禁用该插件。但是微信读书,没有任何通知,没有任何提醒,不会告诉用户不能使用插件,而是直接封掉用户的帐号,然后再冷漠地给出一个模板回复。 软件使用协议 然后我又去找了微信读书的使用条款,检索插件关键词有以下信息: 6.1.2.4对本软件或者本软件运行过程中释放到任何终端内存中的数据、软件运行过程中客户端与服务器端的交互数据,以及本软件运行所必需的系统数据,进行获取、复制、修改、增加、删除、挂接运行或创作任何衍生作品,形式包括但不限于使用插件、外挂或非经腾讯授权的第三方工具/服务接入本软件和相关系统; 6.1.2.6通过非腾讯开发、授权的第三方软件、插件、外挂、系统,登录或使用本软件及服务,或制作、发布、传播上述工具; 6.1.2.4 和 6.1.2.6 均提到了插件的问题,一个是不允许使用插件接入微信读书,这一点上,浏览器的插件要接入微信读书,那么我倒想问问我的浏览器插件那个试图接入了微信读书呢。还有一个,是不允许使用非腾讯开发和授权的第三方插件登录及使用本系统,我的理解是浏览器的插件能够访问到微信读书的网页,所以默认插件在使用微信读书了,但是除了插件,我使用浏览器,无论是chrome,edge,火狐,arc,等等浏览器,这些都是第三方软件,不是由腾讯开发,也没有看到腾讯授权了哪些浏览器,所以用这些浏览器是不是也出问题也是用户的责任。 微信读书的使用条款和微信的使用条款均提到了一样的内容,但是我没找到国际版微信读书的服务协议,于是我又在国际版微信试图寻找是否有类似的规定,我依然输入对应相关的关键词。在国际版微信的使用条款中,我输入插件,外挂,都没有对应的条款。于是我在《WeChat可接受使用政策》 (载列了适用于WeChat使用的良好行为规则。你也可以参考WeChat社区准则来了解WeChat平台上允许和不允许的内容和行为类型)上找到了关于插件的条款。 q. 使用欺骗、漏洞利用、自动化软件或任何未经授权的第三方软件修改或干扰 WeChat 软件; s. 开发与 WeChat 软件相互作用的任何插件、外部组件、兼容或互连元件或其他技术,除非我们明确允许您通过 WeChat 软件进行此操作(在这种情况下,您使用此 WeChat 软件可能须遵守我们通知您的附加条款及条件)。 可以看到表述,没有使用,有的只是,修改或干扰,开发,针对的都是实质性的对软件运行造成影响的行为,而不是像国内版一样,通过非腾讯开发、授权的第三方软件登录或使用本软件及服务。 最后 说实话,还能怎么样呢,我想其实很多人,都已经习惯了,永远不知道雷区在哪里这样的情况,所有事情,好像都不知道自己怎么就触犯到了那根神经,敏感的神经,检测爬虫的神经…… 就像我一个亲戚,他中年男人,对政治敏感度不高,但是又喜欢评论政治,于是就在抖音上,发布了自己的一些真实想法的评论,然后抖音就被封号了,后面他跟我们讲这些事情的时候,我也就是淡淡说一句,这些都不能发的,你最好评论都不要用,视频也最好不要发,你就每天刷刷抖音,点赞,关注什么的都没必要。 这件事之后,我也在想,我使用国内的软件服务,已经是受够了,我的豆瓣,随便发点什么,都要审核老半天,除了发开开心心的吃吃喝喝,否则就是一天起步的审核;小红书,一个这么大的企业,发的内容,是一点其他 APP 的都不能有,动不动就是引流,我不知道这是不是为了维护小红书内容的质量,但国际上的社交,或者搜索软件,我没看到有这样的直接不允许发布的行为;还有很多问题…… 我也在想,除了微信读书,还可以用别的什么应用呢,用这个吧,https://play.google.com/books 还有些想说的,但时间有点儿晚了,或许之后我再追加修改吧。 追加于 2024-03-17 14:12:55 左右滑动查看更多图片 一些来自其他遭遇此问题的用户与微信读书客服投诉的情况 我跟我的朋友说,所以我现在不想再写微信公众号了,也不想再发朋友圈了,聊天也尽可能地选择 iMessage,支付也选择支付宝先,我说我想到我再给微信贡献什么数据信息,不管有用没有,我的使用行为,我的使用数据,我都觉得恶心,觉得自己是在犯贱……其实有什么用呢,很多时候都是口嗨罢了,微信支付和支付宝又有什么区别,底色不都是一样的。 我之前没有被莫名其妙地封过号,封号的经历是有 PayPal 及其严格的风控,我当时似乎是注册了一个美区的帐号,然后那个帐号我也没用,就是注册好,登录,然后就说被永久地封掉了;还有一次是我的微信,2022 年底,ChatGPT 出现,很多人搞各种各样的微信机器人,我也去弄,扫了非登录官方平台的码。这些能找到原因的,我都可以理解,可是没有理由,或是不合实际情况的理由丢给我,实在是让人觉得傲慢。 我想大家都该意识着,这些中心化的数据,给软件服务商的,大部分,都不是自己的,就像我写在公众号里的、聊天的、朋友圈的、社交媒体的…… 这些文字、图片、视频、都不是我的;我能够暂时的使用它们,只是主大发慈悲,赏给我一秒钟。

2024/3/15
articleCard.readMore

AI 手机随想 | 人工智能与智能是否在一个维度?

AI 生成的摘要 这篇文章探讨了AI技术在智能手机领域的应用和发展趋势。主要内容如下: 作者回顾了智能手机发展的历程,从早期手机品牌和系统的多样化,到现在趋于同质化的现状。 分析了目前各大手机厂商在硬件和系统层面的相似之处,认为手机发展已进入瓶颈期。 介绍了魅族提出的"AI手机"概念,通过与第三方大语言模型结合,让用户只需表达需求,手机就可自动执行相应操作。 讨论了AI手机存在的挑战,如隐私保护、交互方式的易用性等。并认为纯对话方式可能不够高效。 对比了传统智能手机和期望中的AI手机形态,认为AI手机的发展或许需要在智能化和易用性两个维度上突破。 最后作者对AI手机的未来发展抱有期待,期望它能成为新的转折点而不只是概念炒作。 总的来说,文章比较全面地阐述了AI技术对当前手机行业的影响,并对AI手机的发展前景进行了探讨和展望。 由于大语言模型推出引起的空前关注,ChatGPT、Sora、以及 Gemini 等产品让各行各业都开始真正体验到 AI 的强大能力。尽管目前 AI 的使用更像是以应用程序的方式来进行,一些厂商迫不及待地提出 AI 手机这一概念,它的出现似乎要标志着传统智能手机进入新阶段,它将为用户带来更智能的体验。但纵观功能机到传统智能手机,以及智能手机这几年的发展,现阶段的 AI 手机是否达到了可以过渡的形态,理想的 AI 手机又该是什么样? 导语 2 月的最后一天,魅族在珠海长琴岛上举办了一场魅族特别活动,在这次特别活动上,魅族邀请了之前负责营销的李楠和负责魅族手机系统 Flyme 的杨颜两位老魅友,发布了其宣称 All in AI 后的最后一款传统智能手机,也可以说是 All in AI 后的第一款 AI 手机。 我通过魅族社区魅友报名前往了此次活动现场,我在申请理由里面写到,尽管自己已经在 2022 年从魅族转到了 iPhone,但出于此前多年对魅族的情感,以及魅族备受称赞的产品设计和用户体验,让我一直没有停止对魅族的关注;而尤其是在魅族发出 All in AI 的消息之后,我渴望亲身体验并分享这种创新。 除了魅族 All in AI 的消息,最近这些天,还有像苹果公司放弃了造车计划,OPPO 也在除夕夜前宣布正式进入 AI 手机时代,好像都有意无意地在传达着智能手机要转型到 AI 手机了。在这篇文章,我想从魅族这次特别活动作为入口,来分享一些我对最近这些年智能手机发展历程的看法,以及讨论关于未来 AI 手机可能的新形态。 越来越统一的智能手机 我在高二那年第一次接触到魅族,魅蓝2,在那个智能手机鱼龙混杂的年代,各种各样的智能手机,有品牌的,没有品牌的,华强北的山寨机强势存在,整个市场的智能手机水平差距非常大。魅蓝2 的系统让我第一次就爱上了;设计,界面,交互,性能,都让我觉得和当时其他的很多杂牌子手机不一样。后面数年,我便一直在使用魅族的手机产品,直到 2022 年,因为 Google 安装服务这方面的问题,让我在使用一些 App 时困难重重,而当时各大手机厂商的产品已经是趋同化了,很难再去说出不同的手机有什么区别,做选择的时候,仿佛更多地还是一些情怀,我便直接从安卓阵营换到了 iOS。 左右滑动查看更多图片 曾经非常丰富的智能手机市场,有很多我一看到就觉得熟悉的名字,朵唯,小辣椒,酷比,酷派,亿通,长虹等等。图片来源:《这十八年》致中国手机行业,每一位奋斗者,见证者,支持者 系统层面 就拿现在的魅族来说,曾经魅族最引以为傲的特点之一 Flyme,在最近这些年,已经越来越难说出 Flyme 与其他厂商手机系统的区别了。如下面这张表格所示,Flyme 最早推出的手机小窗模式、全局夜间模式、游戏助手、状态栏歌词、OneMind 智能思维引擎、轻触返回,按下回到主屏幕,长按打开语音助手的 mBack;Smartisan OS 推出的闪念胶囊、大爆炸、和一步;iOS 广受好评的流畅动画、安全的系统、3D Touch、无障碍的支持、全家桶生态;iOS 和 Flyme 印象深刻的手机查找;安卓的截屏和 Nearby Share,iOS 的 Airdrop 等等诸多不同系统的功能,现如今,在各大手机厂商的系统上都逐渐具备并完善。而系统的发展,从已知的更新情况来看,此刻除了 AI 这一特点,各大厂商似乎找不到新的方向,毕竟如果还想要和 iOS 一样彻底去掉广告,对企业的营收又会是一大问题。 系统/类目 ColorOS 14 Flyme 10 HarmonyOS 4 HyperOS iOS 17 One UI 6 OriginOS 4 个性化主题 ✓ ✓ ✓ ✓ ✓ ✓ ✓ 悬浮小窗 2019.11 ColorOS 7 智能侧边栏 2018.4 Flyme 7 小窗模式 2020.9 EMUI 11 智慧多窗 2020.4 MIUI 12 全局自由小窗 - 2018.11 OneUI 1 2020.11 OriginOS 1 资源调度 ✓ ✓ ✓ ✓ ✓ ✓ ✓ 游戏模式 ✓ ✓ ✓ ✓ ✓ ✓ ✓ AI (LLM) 自研AndesGPT 文心一言 自研盘古大模型 自研大模型 - 文心一言 自研蓝心大模型 手机查找 ✓ ✓ ✓ ✓ ✓ ✓ ✓ 隐私保护 ✓ ✓ ✓ ✓ ✓ ✓ ✓ 生态互融 ✓ ✓ ✓ ✓ ✓ ✓ ✓ 如上表所示,我根据各大系统厂商主页、宣传视频、部分系统提供的使用手册、以及我自己使用手机的体验,仅选择了部分类目进行简单的较,不同系统实现的方式也不尽相同。此外,这些操作系统依然有各自的特点,例如,OriginOS 4 中行业首发的「全链路停车助手」、ColorOS 14 的下一代空间音频技术「全息音频」、HarmonyOS 的「隔空手势」等等。 手机硬件层面 除了 Android 和 iOS,以及 Android 定制系统之间的对比,各个手机品牌虽然秉持着不同的价值理念,但在硬件上,手机的用料也越来越相似。曾经,光是一个芯片的问题,用户很轻易就能比较出不同产品的优缺点。比如,MTK 没有被认可的旗舰级芯片,三星猎户座没有全网通,而现在,联发科的天玑广受好评,三星猎户座也能支持全网通。 还有像是耳熟能详的「充电五分钟,通话两小时」、「照亮你的美」等等重点介绍功能,主打电池,拍照的手机标语;而现在的标语变成了「蔡司影像 心临其境」、「大师影像 更有分量」、「忘情一刻, 真徕卡」统一的影像和统一的 AI。以前标语宣传主打的时候,可以宣传芯片满血,屏幕刷新率和尺寸等,续航能力,手机材料等等,现在这些都被统一化了,留下来的卖点就只有还能再在算法上努把力的影像和还不太明白的 AI。 如下图所示,我简单的整理了各大手机厂商的旗舰机型的配置情况,无论是在这些看得见地方,手机厂商努力地堆砌最好的参数「卷」到最高的比分,还是在一些看不见的地方,从前 iPhone 的主板整洁备受好评,现在,后盖下的工艺也来到了统一的高水准。 趋同化可能也并不见得是一件不好的事情,但总觉得哪里不对,给我的感觉是,厂商可以偷懒不用去想用户到底想要一台什么样的旗舰手机,而是直接有一个「最好」的标准在那里,厂商只需要努力去够那个标准就可以。我想也正是因为这样一个统一的标准出现,才让很多以前的小众手机品牌开始生存不下去。大概这就是市场,它需要一个标准来让整个市场变得更好,让用户买到更值得信赖的产品。 只是,手机不应该是简单地比较这些冷冰冰的参数,图中所列比较项目也并不全面。不同的用户有不同的「手」,所以自然地,同样的手机在不同用户手上,手机的全数功能带来的体验也会有所不同。这个「好」的标准,应该更全面一点。 AI 手机? AI 手机也面临这样的市场,虽然到了今天,智能手机的发展到了如此饱和的状态,摄影,屏幕,电池,处理器等等各个方面都使出了浑身解数,但是依旧没有明确的、全面的、或者能被大家接受的,到底什么样的手机才可以称作 AI 手机的标准。 其实看手机早些年的发展,很像是要把用户在电脑上完成的工作统统转移到手机上,以前我们只能在电脑上处理文档、浏览网页等等工作。现在,在我们手机和电脑的日常使用上,一台手机能做的几乎可以达到电脑功能的 90%。就连影像,手机都致力于帮助用户省下使用电脑麻烦修图的时间,通过更好的 CMOS 捕获更多的信息来帮助手机更好的 P 图,现在随手一拍,就是一张精修后的摄影作品。所以在手机的功能和电脑的功能逐渐一致后,手机的发展似乎又在追求着和电脑同样的大屏体验和真实感,于是,线性马达让用户点击手机键盘时有了各种各样的触感,折叠屏的出现让手机一边可以在大部分使用情况下维持住握在手中的形态,一边又能在需要大屏体验的时候展开。 如果说手机一直是在往电脑的发展靠齐,但我们好像还没有听到 AI 电脑的出现,微软也只是把 Cortana 砍掉,再以 Copilot 的形式重新出现。电脑的发展在性能上还有很多努力的空间,而手机,正如前文提到的,在硬件和系统上的 PK 则逐渐呈现疲态,不仅因为各家厂商都采用同一款旗舰芯片,是否还因为手机处理的任务有限,慢慢地对性能的追求将更不强烈。所以,手机这次也有了机会,要走在电脑前面,在 AI 电脑出现之前推出 AI 手机吗? 魅族提出的 AI 手机形态 魅族在特别活动上提到的 All in AI 计划,其中即将上线的 AI 功能,有 AI 图库、全新 Aciy(魅族手机语音助手)、AI 灵动键、AI 输入辅助;以及一些未来体验,包括 AI 随身秘书、任务机器人、AI 记忆管家、AI 小程序和 Open API 计划。图片来源:魅族特别活动,详情前往:https://www.meizu.cn/thread/22552252 魅族提出的概念是希望用户只用表达自己的诉求,手机就可以帮助用户执行之后的全部操作;而它做出的改变是,有一个便捷的 AI 入口,用户在任何时间,任何场景,轻松唤起;同时,从系统到应用,帐号到数据,设备状态和感知能力等各个维度,这些数据信息开放给大语言模型。 首先将用户隐私数据放到一边不谈,魅族的愿景是,它在系统层面,把自己作为系统服务商拥有的权限,将读取到用户在使用该系统,即 Flyme 中产生的数据,提供给第三方大语言模型,让第三方大语言模型可以更好地读懂来自用户的指令,而魅族则不需要像目前国内的大厂一样,自己设计一个大语言模型,像百度做了自己的文心一言,阿里有通义千文,腾讯的混元等等。魅族只需要做好自己作为系统提供商,考虑如何把数据开放给第三方大语言模型。 杨颜在发布会上举的例子,例如,用户向模型发出指令,查看我少数派上关注的 XX 作者更新情况,包括其他平台的,也帮我关注这些帐号。然后模型根据用户的指令和来自系统提供的用户手机使用情况数据,转化成系统能够识别的指令自动去操作。所以,发出这样的指令后,模型会给出该作者在少数派的更新,以及用户手机上安装的其他 App,例如抖音,哔哩哔哩,假如该作者都在这些平台有帐号,系统将自动帮用户进行关注,也总结出该作者在这些平台上的更新情况。 总而言之,魅族畅想的 AI 就是能够帮助用户自动的在各个 App 之间跳跃,用户只需要发出指令。所以,魅族也才会提出将来可能不再会有 App 这一形态,就像现在,我们出去玩,可能会使用以下这些 App,1、小红书搜索目的地,2、各个 App 比价,3、智行买飞机票,4、去哪儿订酒店,5、微信组群,6、滴滴约车,7、日程 App 创建日程,8、大众点评找餐厅…… 而将来,则是由大语言模型自动地来完成这一切,而作为用户的我们只需要想。 但是,不谈隐私数据是不现实,对用户来说,可能只用在开机的时候点一个同意,就无意中把自己使用手机的数据全部交给了第三方大语言模型,这样的风险是不是太大,要如何处理隐私的保护和加密,也是在实现这一计划非常重要的一部分。 和大模型对话 = AI? 另一方面,发指令给大模型让它来帮助用户执行这些操作真的有提高效率并且在用户体验上是友好的吗?对话,无论是语音还是文字,它都可以被认为是在进行聊天。例如目前的一些对话能力比较成熟的机器人,我可以唤醒它,然后使用普通话发出我的指令,「我要知道明天天气如何」,这和我打开手机点击天气 App 查看天气,并不见得前一种以语音的方式要更高效。 而且,语音还面临着很多使用少数方言的人群,聊天机器人读不懂用户指令的情况。现在的手机厂商,基本都都是把大语言模型的能力放进自己的语音助手中,但我一直觉得语音助手是无障碍的一部分,它可以更好的帮助视障人群使用手机,而对于大多数用户,并不是作为一个主要的交互方式。 目前,我们和机器的沟通,采用的是与屏幕的交互,机器把自己的能力可视化地展现在手机屏幕上,用户自己动手去点击不同的按钮,点击确定,返回,点击不同的 APP 这一交互方式,而 AI 手机则是尝试把用户的这些点击,用键盘打字等行为,全部通过用户的语音或文字来描述以获得与机器的交互。 那如果不使用对话,不是就用不上像 ChatGPT,Gemini,文心一言这些产品了吗?所以其实还是交互方式出现了问题,并不应该是让用户去描述自己想要做什么,**因为发出一个合适的指令同样需要一定的学习成本,**不然 GitHub 上的 ChatGPT 调教指南不会获得那么多的 star。如同我们人与人之间进行的沟通,讲清楚一件事情,往往需要很多的辅助,可能是准备一个幻灯片,一个视频,丰富的例子。沟通成本的降低可能依赖于亲密关系,我们常说的「你一个眼神,我就知道」,这是高度的信任和彼此的了解带来的加成。那机器呢,魅族提出 Open API,让大语言模型读到更多用户的信息数据,然后努力成为一个更懂你的人吧。 除了当前大语言模型的对话,其实 AI 早就已经深入到我们的手机使用上了,用以解锁的 FaceID 就是用基于深度学习的人脸识别技术,部分手机厂商采用的虹软算法以优化计算摄影的图片渲染,还有三星在 Galaxy S24 系列上的 AI 变焦,也有媒体曾表示 S24+ 是一个合格的 AI 手机先行者,还有运用机器学习的智能思维引擎在后台合理调度资源分配等等。AIGC 的出现,似乎是一支强力的助推剂,加速着所谓 AI 手机的诞生。 结语 发布会结束的时候,长琴岛的海岸边上,海风呼啸,烟花开始燃放,心中感慨非常多,像是在庆祝,又像是在告别。而正如文章封面图描绘的立在海浪中的魅族 Logo,它就站在烟花的一旁,好像同整个手机行业一样,正经历着「乘风破浪」,也共同迎接着这份庆祝和告别。 智能机这个概念应该是从 2007 年第一代 iPhone 面世,把从前的功能机时代逐步转向了智能机,在国内,魅族 2009 年发布了其第一款智能手机,魅族 M8,也是国内最早使用电容触控屏的智能手机。今天,魅族希望再次拿到了这个定义上的第一,发布了自己的第一款 AI 手机。很显然,魅族面对的不再是 2009 年那个市场,魅族自己的状态或许也和那个时代有了巨大的改变。 我们曾把智能手机翻译叫 smartphone,而现在的 AI 手机,中文叫人工智能手机,比之前的智能多了人工二字,翻译为 Artificial Intelligence,它会更加 smart 吗?**曾经乔布斯在初代 iPhone 发布会上画的坐标,横轴为易用性,纵轴为智能化程度,来阐述一个真正的智能手机应该是什么样,那就是 iPhone。**2024 年初 Vision Pro 的上手体验似乎在易用性这个维度上,为交互带来了崭新的发展,但智能化发展还不够。今天,AI 手机的维度,是否要从使用平面坐标到使用立体坐标来定义,它是不是将成为一个新的转折点,还是只是用来占据一个概念上的红利。 手机的全称是叫手持电话、还是智能手机、又或者是手持的机器,因为叫手持的机器,才会想着又要把电话、相机、游戏机、MP3、Kindle…… 塞进手机吧,手持的数码机器还有 Rabbit、AI Pin、以及其他还没出现的手持产品没加到手机里,那么是不是……无论如何,我对未来手机的发展充满期待。

2024/3/4
articleCard.readMore

不用世界迷雾,还有这些工具来处理足迹

AI 生成的摘要 这篇文章主要介绍了世界迷雾这款用来记录和展示足迹的应用,以及在世界迷雾之外,还有哪些其他工具可以帮助用户获取和处理足迹数据。主要内容包括: 介绍了世界迷雾的基本功能和特点,如多资料库、快照等新功能,以及迷雾资料库提供的各种扩展工具。 对世界迷雾的使用体验和售后服务进行了评价,并解释了其较高定价的原因。 介绍了与世界迷雾同类型的一些其他足迹记录应用,如一生足迹、灵敢足迹等。 详细列举和评述了多种在世界迷雾之外获取足迹数据的工具,包括GPS Visualizer、gpx.studio、Footpath、Guru Maps、两步路、Flightradar24等。 简单介绍了一些展示足迹数据的可视化方案,如AntV L7、dérive等。 总的来说,这篇文章比较全面地罗列了处理足迹数据的各种工具选择,为喜欢记录足迹的用户提供了参考。 其实想写一篇「世界迷雾」的文章已经很久了,刚好在去年 11 月世界迷雾也迎来了一次比较大的更新,我新建了一个文件,零零散散加了一些内容,一直拖着没有好好坐下来去写。直到前些天我在少数派的首页看到这篇文章,App+1 | Rond 与世界迷雾:现实世界的塞尔达传说地图册 才想起来。在这篇文章我想介绍世界迷雾更新变化,我的一些使用心得,以及整理在世界迷雾之外的轨迹处理工具。 世界迷雾 世界迷雾是一款用来探索世界的 App,于 2012 年推出,用户可以通过定位来录制当前的轨迹,而被迷雾笼罩着的地图,会随着定位移动不断散去,清楚地为用户展示探索世界的百分比及各项成就。 刚好又是一年春节将至时,ElijahLee 曾在《春节将至,归乡路上用它拨开「世界迷雾」》这篇文章里详细的介绍了 3.0 版本后的迷雾,作者大刀阔斧地修改了整体 UI,成就,护照,同步,勋章等界面都更具现代化,但遗憾的是在功能上没有给用户带来较大的惊喜。 新的多资料库与快照功能 一年过去,期间作者也对地图显示进行了一些更新,用户可以选择将地图设置为不可见,也可以设置为不透明等。到了去年 11 月底,迷雾更新了 3.6 版本,带来了 多资料库和快照,对新用户来说,以前影响整体美观的航迹,不再需要犹豫要不要记录或者担心将来的辛苦擦除了,多资料库允许用户将不同类型的轨迹存储在不同的资料库中。除了不同类型,不同地点,不同时间等,都可以根据自己需要,来决定如何使用多资料库。 左右滑动查看更多图片 世界迷雾作者博客给出的多资料库使用介绍图片,图片来源 快照功能弥补了之前只有备份功能,出于迷雾的备份机制,导致在需要修改轨迹时,操作比较繁琐。现在用户可以将自己的数据库快速恢复到此前建立快照时刻下的状态。而快照作为单一文件,也比备份文件更方便地在设备之间进行转移。我目前是把快照当作备份来用,在作者的更新博客中提到了 时光机 这一概念,我在想以后是不是可以通过快照,在应用中,为用户真正带来时光机,通过前端交互,可以随时查看随着时间流逝的轨迹变化。不过,赋予太多功能,似乎也容易让迷雾变得不那么「纯粹」。 左右滑动查看更多图片 世界迷雾作者博客给出的快照功能使用介绍图片,图片来源 迷雾资料库 - Vic 所以在应用之外,很多功能被一些热心大佬用户开发出来供大家使用,我使用比较多的是由 Vic Wang 开发的 迷雾橡皮擦([国内网络访问] [其他网络]),通过橡皮擦,可以擦掉偏移,导入错误,等轨迹。他还整理了一个专门的迷雾资料库,里面包含了前面提到的橡皮擦;还有中国铁路数据,如果高铁上没有在靠近车窗的位置,就可以通过 Vic 整理的铁路数据进行下载导入;铁路数据目前累计长度已经达到 173,109,262 米。 除此之外,还有迷雾时光机和区域成就,根据历史存档,地图会随着时间轴变化不断增加新的轨迹;区域成就则是拓展了在迷雾应用中只能查看到世界探索进度这一功能,通过高德地图 API,导入数据,选择对应的省市区县,就能查看对应区域的探索情况。 从相片导入地理位置,GPS 坐标转换,CSV 文件转地理位置文件,1% 世界探索计划,雾布斯排行榜等小工具也让 Vic 的迷雾资料库更加丰富。在微信公众号上搜索「迷雾资料库」可以了解到更多详细内容 ,还能提交暂未收录的铁路数据,加入排行榜和 1% 探索计划等,里面也提供了赞赏通道来继续支持作者的开发服务。 200 块? 世界迷雾目前提供了 iOS 和 Android 版本,用户可以在 App Store 和 Google Play Store 以 200 人民币左右购买使用。安卓用户提供了 30 天退款保证,如果在 30 天内对世界迷雾感觉到不满意,只需要发送在 Google Play Store 购买订单号到作者邮箱,付款将会被原路退回;而 iOS 用户的退款政策则是由 Apple 决定。不过,如果之前申请了退款,谷歌和苹果有可能不会让用户再次购买相同的应用程序。 因此,高达 200 块的价格,对很多想要体验的朋友是一个劝退的选项。在迷雾群里的雾友们总是说,以后会为了升级要专门绕路,专门出去,花的钱要比购入这个应用多得多。但是在考虑要不要付费购买这样一个单一功能,只是记录显示定位轨迹的应用时,很少会将这个费用与购买之后要产生的费用去比较。其实我在一开始也不理解,为什么现在世界迷雾要卖这么贵,从 2012 年到今天,物价似乎也没有上涨如此快;直到体验到「硬核」的售后。 2022 年我换到了 iPhone,刚好那个时候 3.0 版本正在进行 beta 测试,在 TestFlight 上提供了免费使用的机会,那时价钱应该还没有到 200 人民币。正当我开心可以安卓和 iOS 双持时,去年四月份,伴随正式版本的发布,测试结束,在 TestFlight 拖满了最后 90 天期限,于是就又先暂时换回安卓来使用。安卓是我在 2019 年 3 月份购入,那时价格是 60 人民币左右。 左右滑动查看更多图片 安卓和 iOS 都已经「购入」。 换回安卓后,就发现了一些问题,主要是谷歌框架;我在使用世界迷雾记录的过程中,经常是无法定位。虽然,这很大程度上是手机的问题,因为其他安卓手机用户是可以正常使用世界迷雾的。我给应用的开发者发了邮件,描述了我遇到的问题,**我们之间来来往往有将近一百多封邮件,**他单独把我拉入到了 Google Play 的内测项目,协助我找到无法定位的原因。在这期间,他上架了多个测试版本供我下载,将日志文件可视化到应用界面。最后也顺利发现了问题所在,在一定程度上解决了我的问题,手机再次可以使用世界迷雾来记录轨迹。 这段经历让我想到,一个靠谱、及时、耐心且能真正解决问题的 VIP 售后服务,是否也算是每一个付费软件中费用的重要组成部分。 左右滑动查看更多图片 左图为「独一无二」版的世界迷雾,右图为在第 102 封邮件时解决了问题 使用心得 其实,对我来说,用世界迷雾,其实最开心的瞬间,是把手机放在车上靠窗的地方,**我看着它一点一点地冲破前方的迷雾,到达目的地,再重新启程。**这不单单是为了轨迹的记录和日后的回顾,更像是它官网所介绍的,游戏体验,和我玩「原神」,在提瓦特大世界跑图,有相似感觉。我想,除了前面介绍的 UI 和功能,这大概也是世界迷雾可以在一众软件里面被大家选择的重要原因之一。 从下面截图可以看到,世界迷雾在 App Store 旅行分类下,付费应用中,中美日韩等各地区应用商店都处在 Top 10。 https://apps.apple.com/us/charts/iphone/travel-apps/6003?chart=top-paid 其中的 us 换成其地区代码,可以查看世界迷雾在其他地区的排名情况。) 不过,将探索世界带去游戏体验的产品,世界迷雾并不算是最专门,热度较高的有像 Pokémon GO,通过出门冒险,捕捉宝可梦来探索世界;还有这些年较少被人知道的 Ingress Prime,Ingress 由 Niantic Labs 开发,而 Pokémon GO 也是由 Niantic 和宝可梦公司合作开发。Ingress 是一款基于真实世界地理状况,通过定位系统开展的不同阵营多人侵入式虚拟实境游戏。 同类型应用 与世界迷雾在使用体验上,同类型产品有像 一生足迹,灵敢足迹,日迹等。他们都为用户提供了足迹的录制,导入等,各自的不同集中在轨迹显示上。 一生足迹 可以将轨迹以今天、昨天、一周、一生和自定义等日期属性来显示;在地图显示上,用户可以根据个人需求进行高度定制,蓝白绿粉等接近六种颜色的地图样式,高达三十多种的足迹墙纸风格,自由地对绘制的轨迹颜色和点位进行调节。我想如果我没有先遇到世界迷雾,我会坚持使用这款应用。一生足迹作者曾在《为了帮你画一张「人生地图」,我做了这个 App:足迹》这篇文章中对应用的意义、特点和功能等方面进行了详尽阐述。一生足迹可以免费使用,目前,订阅会员一年仅需支付 12 元。就缺点而言,我认为可能存在一些人机交互方面的问题,有时候会出现一些让我感到困惑的操作。 另外,一生足迹在电池效率优化上也非常不错,在迷雾群中使用过的朋友曾表示,耗电要比世界迷雾更少。它还支持 Apple Watch,在一定程度上,我想也能减轻手机长时间定位耗电严重的问题(虽然 Apple Watch 的续航也常常被诟病)。我在作者的微博还看到一生足迹去年推出的 年度总结 分享,以量化数据的方式将自己过去一年的足迹进行概括。 获取我的足迹 无论是世界迷雾,还是一生足迹,两个基本的功能就是获取足迹和展示足迹。针对获取足迹,这些应用都提供了即时定位录制和后期导入。展示方面,世界迷雾的 UI 向来被用户所称赞,而一生足迹也提供了风格多样的地图模板供用户选择。 不过这些应用在获取足迹上都面临着同一个问题,即当时如果没记录上,定位信号不好,无法记录的足迹要怎么补齐?在这两篇 2017 年的文章,《GPX Builder,帮你补全「世界迷雾」里的足迹断点 | App+1》《世界迷雾路径补全方法大全——走过了这世界,想留下点什么》中,作者都介绍了一些补全足迹的方法,像是使用 Google Earth 桌面版本绘制路径,GPX Builder 手动描绘生成 GPX 文件,Flightradar24 下载航迹,以及从 Moves(已于 2018 年 7 月 31 日停止服务)导出等方法。 多年过去,Vic Wang 的迷雾资料库([国内网络访问] [其他网络])基本上可以满足有记录轨迹需求用户的所有期望,无论是从地图绘制新轨迹,还是对已有轨迹进行擦除,导入中国铁路数据,从相片读取位置信息并添加到轨迹,时光机,CSV 转 GPX / KML,中国坐标转换等功能,迷雾资料库都可以做到。迷雾资料库处理数据时都使用本地浏览器缓存,极大地降低了数据泄露风险,但是当轨迹数据较大时,会占据较高的内存进而影响性能表现。 在 Vic 的《推荐一些有趣的 GPS 小工具》这篇文章中,作者详细整理了数据展示,线路绘制,查询等相关的工具,我根据自身使用体验和其他网上资源,将这些用来获取足迹的工具进行介绍。这些获取足迹的方法,有的是通过 GPS 实时定位来记录,有的是在地图上绘制,绘制方法又包含自由绘制,和依据软件内路径算法所规划路径的自动绘制,还有直接下载的路径,主要是公共交通(飞机、火车、公交)上。 GPS Visualizer GPS Visualizer 是 2002 年就诞生的一个在线处理地理数据的实用工具,免费且功能强大;除了绘制路线,还有地理信息文件转换,计算坐标点之间距离,查询海拔高度等多方面的功能。在绘制轨迹上,GPS Visualizer 可自定义程度较高,举例如果是爬一座地图上还没有路线的山,GPS Visualizer 都可以自由绘制,供选择的地图源繁多,接近 80 余种。这是我最早使用的绘制路线工具,也是世界迷雾作者在一开始推荐的补路径工具之一。 gpx.studio gpx.studio 是一款免费的在线 GPX 查看器和编辑器,自从在 Vic 的文章中了解到这个工具之后,我就从 GPS Visualizer 换到了 gpx.studio。相比较 GPSV,gpx.studio 拥有路网的自动吸附功能,这就意味着在绘制路线时,不需要考虑绘制的路线与地图路线是否有偏差,只需要在合适的距离之间设置起点和终点。gpx.studio 提供的 跑步、登山、骑自行车、山地自行车、摩托车等活动基本上可以覆盖地图上所有路网,取消选中 Routing (follow roads) 则可以不自动吸附地图路线,自由绘制。 gpx.studio 同样是一款免费使用的工具,项目源码也可在 GitHub 中查看。在绘制路线上,gpx.studio还允许用户根据需要扩展时间、心率、步频、功率和温度数据,对已有轨迹的编辑,像是增、删、改也能轻松处理。就具体的操作,作者都在其官方 User Guide 中给出了详尽说明。 Footpath Footpath 是一款可在 Android、iPhone、iPad、Apple Watch 和 Web App 上使用的路线规划应用。和前面两个工具只能在网页上使用不同,Footpath 主打路线规划,这意味着需要为用户进行导航,多平台变成更重要的选择。Footpath 可以在手机上用手指描绘来生成路线,它需要登录帐号,登录后能在多个平台之间同步自己的路线轨迹。 绘制路线上,Footpath 也支持路线吸附,提供了驾车、飞机、火车、游泳、滑雪、步行等三十多种交通方式,整体的 UI 也更现代化。我曾经在使用他们的网页服务时,导出路线等还不需要登录帐号,现在一些功能都逐渐转移到了会员上,目前提供了一年 24 美元的会员订阅服务。 Guru Maps 和 Footpath 一样,Guru Maps 也是路线规划应用,不同的是,Guru Maps 不支持用户在地图上绘制路线,其路径规划的原理是,通过软件提供的最优路径,离线地图与离线搜索,GPS 的实时跟踪,地点标记等,帮助用户规划路线。因此,Guru Maps 在获取足迹上,主要是软件内规划的路径导出和实际 GPS 的定位记录,路径规划上,Guru Maps 支持驾车、步行、自行车、摩托车、卡车和直线(直接路径)多种导航方式;其导出的文件格式支持 KML / GPX / CSV。 目前提供了 Android、iPhone、iPad、Mac 版本的支持,应用也提供了 Pro 服务,以 198 人民币购买终身许可,或是 100 人民币每年的订阅费用;免费版只能创建有限的地图和路径,最多只能创建 15 个固定地点、记录 15 条轨迹,在设备上下载 3 个地区的矢量地图。 左右滑动查看更多图片 Guru Maps 通过软件内提供的路径规划,将路径保存后可导出为对应格式化的轨迹文件。 两步路 两步路 也是路线规划类应用,不过相比较前面两种,两步路则在工具属性之外增加了社区的功能,我身边热爱徒步、登山的朋友也经常使用这款应用。对于利用两步路来获取足迹,和 Guru Maps 一样,提供了实时定位记录轨迹和软件内规划路径两种,不过两步路支持手绘,自定义程度更高。 左右滑动查看更多图片 两步路的路线手绘规划与导出 与两步路类似的一些户外工具,像 AllTrails 也支持 导出自己的活动轨迹 和 导入轨迹,它还贴心地提供了 轨迹转换工具,能转换的文件格式基本可以满足不同应用平台的需求。佳明提供的 BaseCamp 也能让用户导出路线轨迹等数据。 Flightradar24 / FlightAware 关于飞行足迹的获取,对大多数用户,除了坐在靠窗的位子,手机紧紧贴着窗户板来实时记录;就只剩下到这些实时航班跟踪器中去下载这一选项。不过无论是使用 Flightradar24 还是 FlightAware,**都经常会碰到航迹不完整的情况,**这里我用 FlightAware 举例来解决这个航迹不完整的问题。 拿 12 月 31 日,澳门飞杭州的这趟航班来介绍,在 FlightAware 上可以透过其提供的链接下载到航迹线路图,在网页上可以看到航迹在最后靠近杭州时由绿色的轨迹变成了白色,而在导入到轨迹显示平台上,也能发现白色部分的航迹缺失了。 左右滑动查看更多图片 左边为 FlightAware 上航迹图,右边为导入到世界迷雾后,发现与 FlightAware 白色线段,在最后连接到杭州的航迹上被遗漏。 用文本编辑器打开从 FlightAware 上下载的 KML 文件,从文件中可以看到,导出的航迹文件坐标最后只到了,119.69346 28.43988,同样地,在 FlightAware 上,在 28.4399 119.6935 的位置之后,就丢失了节、公里/小时、米和爬升率等参数,而报告设施也是估计值。 现在只需要将 FlightAware 上这些报告设施为估计值的经纬度手动地添加到所下载的 KML 文件中,由于大多数的足迹显示工具不需要爬升高度等信息,所以在手动添加这些经纬度到 KML 文件时,可以根据需求随意填写对应的高度。 我这里没有修改爬升高度,直接从前面任意段复制了一些过去,将修改后的文件重新导入到足迹展示平台,可以看到,白色段的航迹图连接起来了,成功到了杭州萧山机场。这或许不算是完美的解决方案,但在不需要高度信息的轨迹展示平台上,却是一个值得一试的选项。 左右滑动查看更多图片 航迹最后一段顺利补齐 其他 能够获取轨迹的工具还有很多,在 Google My Maps 中也能把谷歌地图规划的路径导出,然而需要注意,谷歌地图采用的坐标标准与国内坐标的差异。GPSLogger for Android 则是一款相当省电的 GPS 日志记录应用程序,它不显示地图,只显示当前经纬度,页面打开就是一个「开始记录」按钮,记录的坐标可保存为 GPX、KML、CSV、NMEA 和 CSV 格式。和GPSLogger 一样,OpenTracks 在应用内也没有提供地图,不过它主打运动记录,用户还可以添加图片标记等来追踪自己的运动,也支持以 KML 或 GPX 格式导出轨迹数据。 左右滑动查看更多图片 左边为 GPSLogger,右边为 OpenTracks,图源自应用官网;两个工具均在 GitHub 上开源。 Strava 也支持将跑步、骑行或者登山的运动轨迹导出。而在 running_page 这个项目中,作者提供了获取 Strava、NRC 等运动类应用的数据,同时能呈现出色的展示效果。还有一些硬件产品,佳明、华为 GT Runner、高驰 等部分专业运动手表也提供了将定位轨迹以 GPX 等GPS 数据格式文件的导出;X-TRACK 自行车码表也支持记录和显示实时轨迹,以及导出标准GPX 格式的轨迹文件。 左右滑动查看更多图片 running_page 工作原理以及路径展示效果图 高德 / 百度开放平台,在蚂蚁集团的 antV 中提供了大量的数据可视化方案,其中一些项目也给出了行政区划数据,公交地铁等数据。在 上海公交 这个示例中,根据代码中的数据文件,可以获取到上海的所有公交路线和地铁路线。 展示我的足迹 在路线数据的展示上,上面提到的获取足迹工具中,以用户自定义绘制路线来获取足迹的工具,都具备展示功能,因为绘制需要在地图上交互,所以数据显示同样具备。GPS Visualizer,如它的名字一样,可视化 GPS,它支持导入多种类型的路线文件,使用它可以查看去过的地方,规划要去的地方,快速可视化地理数据等,丰富的地图样式也能满足更多人的喜好。gpx.studio 同样如此,特别指出,gpx.studio 还允许用户将轨迹嵌入到自己的网站,这为轨迹数据的多种方法展示提供了选择。 像 Footpath、Guru Map、两步路 等路线规划类应用,都支持导入轨迹,不过一般是只能导入单条轨迹,因此在整体足迹数据的显示上存在一些局限,两步路提供了地图叠加,叠加的多条轨迹能在当前地图中一起显示。 一方面由于大多数的足迹类应用,都具备良好的足迹展示功能,无论是以消除迷雾的方式展示足迹线条的世界迷雾,还有以热力图方式高度自定义显示效果的一生足迹,在一定程度上都能满足大部分用户的需求。另一方面,足迹的展示容易造成隐私数据的泄露,所以可供单独选择的软件服务有限。 足迹的个性化显示也是地理数据可视化的相关工作;AntV L7 又叫 L7·蚂蚁地理空间数据可视化,是蚂蚁集团 AntV 数据可视化团队推出的基于 WebGL 的开源大规模地理空间数据可视分析引擎,项目也在 GitHub 上开源。L7 提供了大量地图模板,但需要考虑的问题是,要先将自己的足迹文件转换成能成功读取的 CSV,JSON,GeoJSON 等数据格式,基本上只包含经纬度信息,然后才能应用到各种图层类型。 左右滑动查看更多图片 左图为 AntV L7 图标样板截图,右边为百度开放平台线图层类型截图 除了地图服务商的资源,在 GitHub 上也有一些项目来更好地展示自己的足迹。dérive 能根据轨迹生成路线热力图;还有 GPX Animator 能从 GPX 文件生成动画视频,展示足迹移动的过程;GpxTrackPoster 可以将多个 GPX 文件展示为海报格式。 结语 正如标题所说,不使用世界迷雾,使用其他同类型的产品,也可以对足迹进行处理;另一层意思则是,使用世界迷雾,但是无法透过世界迷雾来获取的足迹,也可以在上述提到的那些工具中找到足迹处理的方法;无论如何,希望介绍的这些工具,能为喜欢记录轨迹的朋友带去帮助。 本文首发于少数派,不用世界迷雾,还有这些工具来处理足迹 - 少数派 (sspai.com)

2024/1/5
articleCard.readMore

Windows Copilot:操作系统层面的 AI 助手?

AI 生成的摘要 这篇文章主要介绍了微软最新推出的 Windows Copilot 功能,并探讨了 AI 与操作系统整合的可能性。主要内容包括: 介绍了 Windows Copilot 的基本功能,它类似一个基于 Bing Chat 的聊天机器人,可以回答问题、总结网页、创作图片等。 与传统操作系统语音助手不同,Copilot 集成了强大的 AI 能力,可以更好理解和响应用户指令。但在实际体验中,它的 AI 能力似乎受到一定限制。 除了 Copilot,Windows 11 的这次更新还为画图、照片等应用带来了 AI 辅助功能,如 DALL-E 生成图像等。 文中对比了其他公司的 AI 产品,认为它们通常服务于特定应用,而 Copilot 则试图作为操作系统层面的统一AI助手。 分析了苹果在 AI 整合方面的做法,以及出口管制等原因可能影响 Copilot 在某些地区的使用。 最后探讨了 AI 真正与操作系统无缝整合的可能性,认为 Copilot 目前更像一个新应用,是否能成为"日常AI伙伴"仍有待观察。 总的来说,文章全面介绍了 Windows Copilot 的功能,并对其意义及 AI 与操作系统整合的前景进行了分析和思考。 在 9 月 21 日的 Microsoft Event 上,微软发布多款软硬件新品,同时宣布 Windows 11 将在 9 月 26 日进行更新。微软在这一次的更新中为 Windows 完善了现代化 UI 的文件资源管理器,带来了Windows 备份,开发人员主页,音量合成器等150多项更新,但最值得关注的是 Windows Copilot,以及为画图、图片等应用带来的 AI 功能。从微软与 OpenAI 的关系,似乎就注定了微软会持续地为自己的产品带去人工智能的能力。 初步介绍 在更新后的 Windows 11 中,微软将 AI 功能集成到整个系统,用户不再需要到 Edge 中使用 Bing AI,而是可以在任何场景下,点击状态栏的 Copilot 图标,或者使用快捷键 WIN + C ,就可以在屏幕的最右侧直接使用,而原本显示的内容也会自动缩放,分屏等操作也会自动在当前的页面大小下进行划分。整个应用给人的初印象,是把 Bing Chat 的网页以 Electron 应用的形式提供给了用户。 功能特点 Windows Copilot 预览视频 Copilot 推出已经有一段时间了,之前的 Logo 也与这次发布的不同。在我目前所在的内测预览版本中,Copilot 能够完成一些非常简单的与系统交互的工作,像是截图,打开某些应用,很有一种之前呼出 Cortana (Windows 在 Copilot 提供服务之前的语音助手)来完成一些打开应用程序这方面工作的感觉,它算不上应用到了大语言模型技术的智能。 我也尝试在 Edge 里面打开一个网页让它对当前页面进行总结,似乎是做到了;但是在 Chrome 或者其他页面的时候,它有时候又会提示没有办法访问到你的屏幕或者给出错误的答案。这个时候,当我们点击浏览器地址栏的时候,复制网页地址,Windows Copilot 会自动监听到这一复制行为,会提示用户是否要将所选或复制的文本发送到聊天;发送网页地址后,它就像其他的聊天机器人一样进行总结。而在使用这类服务的同时,Copilot 和其他所有的「ChatGPT」们一样,也不可避免的会有错误信息的出现。因此在功能上,Windows 更像是一个结合了 Cortana 和 Bing Chat 两种服务的人工智能助手。 和 Cortana 一样对话 之前在使用 Windows 的人工智能助手,我们只需要说一句「Hey, Cortana」就能够唤起它帮助我们处理与操作系统的工作。而现在必须是快捷键或者鼠标点按的方式进入,得益于 NLP 技术的突飞猛进,语音识别的准确度在我的体验中似乎是有了一些进步。在用户使用语音输入的时候,Copilot 会提示用户「语音输入由 Microsoft 联机服务处理,不会进行收集或存储。」 在支持的语言方面,当我们以英语作为语音输入的时候,Copilot 也会以英语回复,根据不同的账户在 Windows 上下载的语音包,Copilot 使用的语言除了英语和中文,还有日语、西班牙语、法语、德语等。在当前我使用的内测预览版本中,与 Cortana 不同的是,当我尝试让 Copilot 去完成一些控制我的电脑的工作时,它会说「你好,这是必应。我很抱歉,我不能帮你最小化所有的窗口。这是因为我只是一个聊天模式的必应,我没有权限控制你的电脑或浏览器。我只能和你用不同的语言聊天,或者用我的知识和创造力生成一些有趣的内容。」 和 Bing Chat 一样聊天 如上文提到的图片示例,Copilot 一样可以聊天,撰写,以及提供见解。如果拿 Windows Copilot 和 ChatGPT,或者是向 POE 这类整合商的产品作比较,唯一的区别只是进入的方式不同, Windows Copilot 试图为用户提供一种无缝衔接的感觉,在使用 PC 的任何时候,任何场景都可以无缝接入。而对应的回答效果,则是更多地与背后使用的不同语言模型有关。关于图像的创建,Copilot 只能为已使用个人账户登录的用户生成图像。因此前在内测预览版本中,它更多时候还是和 Bing Chat 一样,与系统的整合依旧比较弱。 在 Microsoft Event 上,正式版的 Windows Copilot 可以做到的是更多,从微软的 博客 里面可以知道,Copilot 能够在更多方面,直接与电脑的当前页面进行深度的合作,截取当前页面或者直接截取图片然后通过 Copilot 进行编辑处理。而在 Edge 中的 Bing Chat 和 Microsoft 365 Copilot 也与 Windows Copilot 一起在微软的人工智能时代实现了功能的统一。 简单对比 Bing Chat 帮助用户更快的找到 Bing Search 的搜索结果;Bard 也完善了 Google 的搜索功能,激发用户创造力和提供效率;Github Copilot 可以帮助程序员写代码,和 AI 结对编程;Notion AI 可以帮助用户创作自己的 Notion 内容;Adobe Firefly 为 Adobe Photoshop 带来了 AI 绘图的功能,对图片的操作一句话就可以做到;Office Chat 协助办公用户高效地处理 Word、Excel、PPT 等文档…… 这些 AI 工具似乎都是为某一应用程序设计开发的,其目的都是为了完善原有应用的使用体验。 而 Windows Copilot 似乎是要把这些不同的功能的「 AI 伴侣」都统一到一个 AI 上,用户在使用 Windows 进行任何工作的时候,无论是搜索、编程、办公、艺术创作……都可以通过 Windows Copilot 方便快捷地进入人工智能的辅助工作。 正如上文提到的,如果说 Windows Copilot 和其它的大语言模型的最大区别是入口的不同,那么考虑 Copilot 与操作系统的传统语音助手的区别又有什么不同。同时是人工智能的产物,苹果的 Siri 和微软的小娜(Cortana)都可以通过一些特定的指令,完成与系统的交互,例如「给 XX 打电话」、「设置一个 XX 点的闹钟」、「提醒我完成 XX 在 15 分钟之后」、「播放音乐」…… 而 Windows Copilot 的特点则在于其集成了强大的AI能力,使其能够更好地理解和解释用户的指令,并提供更智能、更个性化的响应。但是,在我的实际体验中,如果是寻求 Copilot 来处理这些事宜,它的 AI 能力似乎是被局限了;让 Copilot 处理更多的工作,也意味着用户需要把更多的隐私数据交给语言模型。 Copilot 之外 除了 Windows Copilot,Windows 这次的更新还为画图和照片等应用程序带来了 AI 的功能。在此前的内测预览版本中,画图应用已经为用户带来了多图层的功能,同时提供了深色的主题。而在接下来的更新中,画图还将使用 DALL-E AI 人工智能图像创作器 Cocreator 来协助用户完成数字创作绘图。在照片中,也带来了人工智能功能,AI 可以帮助用户轻松编辑图片,像是抠图,把照片主体突出等功能。而在微软应用商店中,则在侧边栏添加了 AI Hub 的分类,在 AI Hub 中,微软将大部分含有人工智能功能的应用程序集中在一起,用户可以便捷的找到适合自己的工具。 今年三月份,微软就在 Office 中加入了 Microsoft 365 Chat,帮助用户梳理工作中的各种文档、邮件、会议等事项。而微软也表示将在 Outlook、Word、Excel、Loop、OneNote 和 OneDrive 中为 Copilot 引入新功能;此前也有一张梗图来调侃微软与 AI。 图片来源 一些思考 但是,AI 到底应该要怎么和操作系统合作呢?我还记得去年 12 月生成式 AI 逐渐火起来,到了 2 月份,各个大厂都说要推出自己的聊天机器人,大家就期待过苹果会怎么样把 AI 放进自己的系统里,但到了六月份的 WWDC,吸引大家的眼球的不是在 iOS、 iPadOS、macOS 更新上花的功夫,而是 Vision Pro 的横空出世。一向注重用户隐私与安全的苹果,在人工智能的应用方面,尽可能地把机器学习的模型都放在了本地,为用户带来了优化后的听写,图像的识别,输入的预测等等功能。同时,尽管 Apple 不断地提升其芯片的神经网络计算能力,而大语言模型学习训练运行所需要的算力,是个人设备难以提供的资源;另一方面,苹果或许是还在等待与生成式 AI 相关法律法规的完善。 当然,因为 美国出口管制条例 ( 美国商务部工业及安全局 在2020年年底就不再将香港作为一个单独的目的地,而是和中国内地一样;但澳门仍然作为一个单独目的地,于是在今年年初,管制条例 又重新加上了澳门。) 和其他原因, Copilot 仍然只能在不受限制的地区使用,中国大陆(内地和港澳)地区该服务是不可用。 距离 Windows11 面向全部用户上线已经接近两年的时间,Windows 的更新好像一直是在 ⌈换皮⌋ 这件事上,或者说最近这几年操作系统上的更新大多数都是在 ⌈换皮肤⌋。直到去年 OpenAI 推出 ChatGPT 获得空前的关注后,应用程序开发者们都在思考要怎么把 ChatGPT 加到自己的产品中,我原以为微软把 Copilot 集成到系统上,将会是 Windows 11 这两年来最大一次功能更新,但体验之后更像是推出了一个新的应用程序而已。或许在任何场景下的无缝访问,加上应对各种使用场景的能力,就已经能算得上操作系统层面真正的日常人工智能伙伴。

2023/9/30
articleCard.readMore

论文,研究,我和社会学的故事

AI 生成的摘要 这篇文章主要从作者个人的经历出发,探讨了社会学、研究和论文之间的关联。主要内容包括: 作者通过与社会学教授的交流,了解到社会学研究往往涉及数据分析,研究社会现象与影响因素的关系。同时发现计算机领域的一些研究工作也涉及社会学范畴。 作者反思了研究的意义和方法,认为研究是一点一滴的积累,即使看似微小的工作也是重要的。研究需要科技和社会、法律的共同推动。 作者探讨了论文的作用,除了作为研究成果的呈现,论文也可以作为真实案例的知识来源,为普通大众提供了获取专业知识的渠道。 作者分享了如何在离开学校后继续获取论文资源的途径,如通过公共图书馆订阅知网、国外数据库等。 最后,作者认为研究是一条越走越窄但交叉学科给予多种方向选择的路,论文是呈现研究成果的重要形式,也为普通大众提供了知识来源。 总的来说,这篇文章从个人视角出发,串联了社会学、研究活动和论文发表三者之间的关系,并分享了一些有益的见解和经验。 有时候我在想,我们所说的科学研究,到底在研究什么,又或者,我们的研究除了那些成果,它可以为我们带来什么。这大概是一个比较复杂,又很空泛,需要一些经验才能得到答案,或者也没有标准答案。所以,这篇文章,我非常主观地,甚至是有一点狭隘地,简单地从我与社会学的故事开始来聊聊这些事情。 我与「社会学」 前段时间我和一个社会学系助理教授聊天,我当时帮助他处理了一些技术上的工作。他教授了一门课,那门课是介绍很多外国社会学家,他当时跟我说社会学很多时候就是一种意识形态传播。结束的时候,我问了老师一句,「现在的社会学是在研究什么啊,是更像一些数据分析之类的工作吗」?他说,「可以这样说,很多时候是研究一些因素和对应的社会现象之间的联系,而这些联系往往需要以数据的形式来量化、可视化」。事后我再去问了 ChatGPT,什么是社会科学,他告诉我社会科学研究的领域很广泛,分支包含众多的学科,研究的方法也是丰富多样,但最终目的都是为了提出解决社会问题的有效途径。 之后几天里,我脑子里一直盘旋着「社会学」这个概念。学院计算机系去年新来了一个老师,是从苏黎世联邦理工过来的博士,本科在北大。我点进去他个人主页看了看,有一篇文章吸引到了我的眼球,是发表在人机交互的会议上,Gay Dating on Non-dating Platforms: The Case of Online Dating Activities of Gay Men on a Q&A Platform1,研究的是同性恋在非交友平台 (知乎)上的约会行为。我当时就在想,这不应该是属于「社会学」研究的内容吗?在计算机系也会有研究社会学的老师吗?我之前对人机交互的概念大概也是去设计、开发和评估用户友好的界面和交互技术,可能比较熟悉的,会是一些可视化相关的工作。我粗略地阅读了这篇论文,和我想象中对文科论文撰写很像,大概就是作者在知乎上去联系了很多在上面有交友意向的男同性恋,然后对他们进行了调查访谈,做了很多分析,然后发表了这篇文章。 还有一次,我记不起来是怎么找到那篇论文,可能是在 GitHub 上看到了作者的主页。作者是在 KAUST 读计算机科学专业博士生,这篇论文,How We Express Ourselves Freely: Censorship, Self-censorship, and Anti-censorship on a Chinese Social Media.2发表在 International Conference on Information ( iConference ) 会议上,论文研究的是我们网民在社交媒体上,主要是微博,如何合适地表达自己,我当下也觉得这是属于社会学范畴,它好像和我们社会更相关,因为无关计算机理论,也不涉及技术。 人机交互是计算机的一个研究领域,像计算机视觉、自然语言处理、计算机网络、软件工程这些领域一样。我问我在社会科学学院的同学,她的研究领域是社会学下面的犯罪学。我跟她说我们专业都有很多研究是和社会学相关,他们也会去做这些研究。她告诉我是这样,但是社会学的学生发论文,不会发到像 CHI (人机交互领域顶级会议) 这种人机交互偏计算机的会议上,他们大部分时候只会发社会学下面的期刊和会议之类。 我与「研究」 随着基础科学不断进步和发展,目前学科之间的联系已经变得越来越紧密。因此,尽管现在科技可以解决很多问题,但是单纯依靠科技又根本不行,它需要社会的合作,需要配套的法律,就像我关注的多媒体篡改检测工作一样,无论是单纯从计算机视觉技术的角度出发去解决这个问题,还是从线上社交网络证据链去找寻篡改足迹,都已经有计算机的研究员开展了大量工作。我便开始觉得,这些工作,光依赖科技手段是不行的,没有社会,没有法律,所谓社会学的研究,其实要解决研究一开始提出的那个问题,会很难;但不解决也有好处,意味着还可以继续研究。例如,我以为是从社会学角度出发,是不是可以讨论一下,用户出于什么目的会在网络上分享经过篡改的图片,自媒体工作者是如何在平台上选择图片或者视频新闻进行取证然后如何决定进行传播。 所以有时候,我就经常问作为一个研究生,做这些简单的研究是不是有意义,这是不是你想做的研究,或者研究到底是什么,入门标准是什么。前段时间我在 OpenReview 上看到这篇文章,Embedding Fourier for Ultra-High-Definition Low-Light Image Enhancement.3,是 ICLR(深度学习领域的顶级会议) Top 5%, 看 Reviewer 最后意见是,作者提出了一个新任务。我大概看了下内容,一开始我在想,图像增强已经有很多研究员做了相关工作,弱光环境下的图像增强也有很多,但这是超高清晰度的弱光图片增强,所以是一个新任务。乍一看好像觉得这不算什么,但仔细想想,研究,就是这样,一点一滴,累积起来。这篇论文中实验部分也做的非常充分,同时作者也针对自己设计的新任务提出了一个专门的数据集。 就像现在,AIGC 泛滥,我关注到一些做图像篡改检测的同学,他们又开始提出一些方法,Generalizable Synthetic Image Detection via Language-guided Contrastive Learning.4,用来对这些合成图片进行检测,检测是不是由 AI 生成。在我看来,现在 AI 生成图像其实更多应该叫画作,而不是图片,大部分图片也是风格化相当严重,所以问题好像来到了,检测一幅画是不是有作者,还是 AI 合成。 我了解到,现在大部分国家或地区好像都没有对这些 AI 生成内容,其所有权是谁,有法律的认定,关于这些内容在社交媒体上的传播也没有做出具体规定,所以,我大概也更觉得这是版权问题,能不能算作版权,版权又应该属于谁,它依靠社会的手段,依靠法律的监管,而科技的力量往往是一种补充。最近一段时间,国内一些针对生成式人工智能服务管理办法也慢慢在完善。 图片来源 正如前面提到交叉学科的现象,社会学和科技,他们其实很难是分得开,所以才能看到上文那些研究工作,在计算机专业研究员发表情况里面。所以,社会学还挺有意思的。突然想起来之前看过一个采访,里面提到我们大学要培养什么样的人才,说就是要到社会去。这么看起来所以是,中文系用笔来改造社会,艺术系用艺术作品,法律系用法律,计算机系用代码… 我也想到,一个议题,与社会与法律关系更大,这不能作为一个计算机系学生去规避以科学技术的手段去解决这些问题的理由,还是应该在自己能力范围之内去做一些事情。科学技术可以做的,正在做的,似乎,也是我们社会,我们法律,正在做的。所以,是不是,我们可以做的,我们正在做的,远比我们想象的,多得多。 我与「论文」 这样的感悟来自于论文,来自论文所研究的内容,通过阅读同一个专业不同方向,甚至是不同专业的论文,去认识当前的部分研究在做些什么。阅读论文可以帮助科研工作者发现当前领域的研究动态,以找到下一个可能是有价值的研究课题。那对于不是这个领域的学术研究员,或者我们大部分的数字网民,读其他学科,或者就是读论文,好像是一件没有什么必要的事情。所以有时候我又在想,是出于什么原因,会让一个人去阅读一个不是他研究领域的论文,论文的作用是什么,研究者会希望自己的论文被所有人看到吗,还是只会想要在自己的研究领域圈子里流行,还是说无所谓。 如果说是为了获取知识,随着现代科技的发展,一本书,一部电影,都可以以一段不超过20分钟的短视频解说完成。获取知识的途径甚至可以说,不太需要再经过书本。优秀的博客,制作精良的视频,在很大程度上,都是比书本在效率要更高的一类媒介。那论文,其实可以说是书本的前身,把一定数量的论文经过编辑出版成书。同时,论文的获取门槛,好像就给一些人搭建了一座有形的墙,这在一定程度上是不是也说明,论文并不是适合所有人的知识传播媒体。 就像有时候我搜索一个东西,第一反应是主流的搜索引擎,然后针对搜索的问题,可能选择不同的平台进一步搜索,是选择去 Bilibili 搜视频,还是在微信里面搜索公众号,还是来少数派搜硬核些的经验帖子,以及这两年逐渐可以替代百度搜索的小红书。 前段时间,家里老人生病了,是皮肤上的病,大家都不知道是怎么来的,只看到临床表现是很多水泡。我还是先到搜索引擎上输入,老年人,水泡,这样一些关键词,然后它告诉我可能是一种叫什么什么的疾病。但我拿着这个名字继续搜索的时候,发现网络上的信息很少,这个时候我想到了知网,我把关键词输入,结果是只要有医院报告了这样的病例,大部分都会以论文的形式发表出来,并且有些进行了详细的统计,配上了真实的图片,治疗等等信息。 我也想起来我之前一位学中药学的室友,他有一次和我提到他爷爷的病情,他告诉我他在论文里看到了某个针对他爷爷疾病的药物治疗情况,我不太记得是新批准的药物,还是组合的治疗方案。他通过和医生的沟通,找到代购,买来了那种药物,不过后面具体的治疗情况我也没有再了解了。 我开始重新思考,论文,这个作为研究结果的呈现方法之一的媒介,是不是还有一点其他的可能,就像这次我的经历一样,论文似乎充当了一种真实的案例来源,是在视频平台,小红书上,不需要去做太多取信工作就可以选择参考的内容平台。 我们与「论文」 在互联网上经常能看到一些作者分享了自己如何在离开学校后找论文,如何阅读论文,甚至是如何写论文,等等。就我自己的这次经验,在知网上找论文,如果已经离开了学校,也没有单位订购,我要向大家推荐的是各省市图书馆,像浙江图书馆、广州图书馆、江西省图书馆等等,他们都提供了知网的在线访问服务,只需要简单的读者注册,就可以在知网数据库里搜索下载论文。而在上海图书馆,他们还提供了 Springer Link/Springer 电子期刊数据库,以及仅限馆内使用的 IEEE Xplore 数据库,Elsevier/ScienceDirect (爱思唯尔,科学指引数据库上也提供了像 柳叶刀 等医学领域等顶刊资源),等这些高校学生经常使用的付费数据库。 浙江图书馆 (在支付宝上搜索「浙江图书馆」,进入生活服务号,在服务大厅中点击「新用户注册」就可以注册成为图书馆读者,浙江图书馆 数字资源 包含了知网等付费数据库。) 广州数字图书馆 (广州图书馆的读者可以在「广图+」小程序或者网页上在线办理注册或激活,不过在线办理时须在广州或佛山地域,或者持有当地的身份证居住证等材料,广州图书馆 数字资源 同样有知网,剑桥期刊等在线数据库。) 上海图书馆 (在线注册,注册的方式还提供了港澳通行证,护照,台胞证等) 江西省图书馆 (江西省图书馆在网页提供了详细的 办证方法,其中的要求是支付宝芝麻分数大于等于550分。) 其他省市图书馆…… 结语 文章里还存在着一些主观,认识不够清楚的地方,我通过把这段我和社会学的经历分享,肤浅地聊了聊研究,还有论文。研究这件事情好像是在走向一个极端,路是越走越窄,但不同学科的交叉让这条路有了更多的方向,走在这条路上的人,好像也有了更多选择。这些研究,无论轻重,无论方向,最后成果总是以论文的方式呈现。而从事研究工作的人通过阅读这些前沿的,不同领域的论文,继续在这条路上前进;但论文可以做到的,为那些没有在做研究的我们,在效率之外,还提供了科学的内容平台。 Wang, Ye, Zhicong Lu, and Roger Wattenhofer. “Gay Dating on Non-dating Platforms: The Case of Online Dating Activities of Gay Men on a Q&A Platform.” Proceedings of the ACM on Human-Computer Interaction 6.CSCW2 (2022): 1-23. ↩︎ Chen, Xiang, et al. “How We Express Ourselves Freely: Censorship, Self-censorship, and Anti-censorship on a Chinese Social Media.” International Conference on Information. Cham: Springer Nature Switzerland, 2023. ↩︎ Li, C., Guo, C.-L., zhou, man, Liang, Z., Zhou, S., Feng, R., & Loy, C. C. (2023). Embedding Fourier for Ultra-High-Definition Low-Light Image Enhancement. In ICLR 2023 notable top 5%. ↩︎ Wu, Haiwei, Jiantao Zhou, and Shile Zhang. “Generalizable Synthetic Image Detection via Language-guided Contrastive Learning.” arXiv preprint arXiv:2305.13800 (2023). ↩︎

2023/8/30
articleCard.readMore

Paperlib 找到文献管理舒服的姿势

AI 生成的摘要 这篇文章主要介绍了一款名为Paperlib的开源学术论文管理工具,并与其他流行工具如EndNote、Mendeley、ReadCube Papers等进行了对比。主要内容包括: 介绍了Paperlib作为一款简洁、免费的文献管理工具的特点,作者因为自身学术背景而偏好使用它。 阐述了作者对文献管理工具的期待,包括论文组织、预览阅读、发现新论文、多平台同步、信息引用等多方面需求。 详细解释了Paperlib如何满足上述需求,如自动元数据抓取、浏览器插件添加论文、arXiv期刊订阅、多平台云同步、快速引用等。 分别介绍了EndNote、Mendeley、ReadCube Papers、ReadPaper等工具的特点,并与Paperlib进行对比。 指出Paperlib的缺点是不支持手机端,缺少推荐系统等,但作为开源软件可自由修改。 总的来说,作者比较偏好Paperlib这种轻量级但实用的文献管理方案,但工具选择也因人而异。 综上,文章对Paperlib及多种流行文献管理工具进行了全面的解析和比较,可作为读者选择合适工具的参考。 Paperlib 是一个免费的,开源的,简洁的学术论文管理工具,由 GeoffreyChen 开发,主要针对计算机科学学科;这篇文章我想聊一下我使用文献管理工具的心得,以及为什么在这里推荐 Paperlib。 导语 无论是在开源社区还是应用市场,文献管理的工具都已经发展的相当成熟了;有老牌的 EndNotes,相信大部分这是大部分高校会选择购买的平台;还有 Mendely,Zotero 这些,相当程度上是可以说完全免费使用的;以及我之前很喜欢的一款叫做 ReadCube Papers 的软件,它的前身是 Papers,曾在 App Store 以买断制提供服务,被卖给 ReadCube 之后,改为每年 24 美元(学生优惠)的订阅制;还有由粤港澳大湾区数字经济研究院的同学们开发的 Readpaper 在最近这段时间,也有了比较多的流量。 实际上,很大程度上决定用户选择的,还是个人喜好。今天讨论的这个工具 Paperlib 也有一部分是出于我自己的喜好。Paperlib 在 GitHub 上开源,开发和维护都只有作者一个人,作者目前提供了 Windows、Linux 和 macOS 的支持。 这个工具让我眼前一亮的是它的界面,足够简单,但是功能又足够丰富,完全不需要任何学习成本,你可以方便的增删查改,管理你的论文。同时,由于开发者也是计算机系的学生,在开发之初就表示主要针对自己计算机领域的论文,所以我在使用过程中也是得心应手。 我是一个计算机专业的博士生,会议论文在我的研究领域里占主要地位。很多会议例如:NIPS,ICLR,并没有 DOI 编码。因此现有的文献管理软件几乎无法匹配他们的发表信息元数据。在我写论文的时候,我不得不一次次得搜索 Google Scholar,DBLP 来确保引文的发表信息无误。 对比于 Zotero, Mendely? 一个好的文献管理软件应该能够自动匹配文献的发表信息,而不是需要用户手动输入。这样可以大大减少用户的工作量。 现代 UI,没有无用的功能。 也许我们需要的只是:导入论文,自动匹配发表信息,简单管理文献库,写论文的时候方便地生成参考文献。 这就是 Paperlib。 ——来自 Paperlib 官网介绍 我对文献管理工具的期待 组织与管理:我的论文被放在足够整洁的表格中,表格的行高,宽度都在保证包含充分的信息的同时,带来赏心悦目的体验;其次,它能提供丰富的查看方式、过滤与排序等,同时要有强大的搜索功能,全文搜索、标题搜索,或者自定义搜索;再有,针对论文的分类,可以有不同文件夹、嵌套文件夹、标签支持、论文智能分类等等;而这些都要我一打开工具就能看到在哪里。论文的添加要提供浏览器扩展、直接拉入论文等多种方式。 预览与阅读:能够在管理工具中快速打开论文查看,并且能保存我自己阅读论文后的笔记到管理工具中以归纳,最好是管理工具就可以为我提供像 PDF Expert 一样丝滑的 PDF 操作体验。 发现新论文:最好可以根据我工具里的论文情况,为我推荐可能有帮助的最新论文。 多平台同步:我的论文可以保存在这个工具内,并且在多个平台间同步,无论是移动端、桌面端还是网页版,都可以随时操作。 信息与引用:可以快速的得到论文的 Bibtex 信息用以导入 LaTeX 或者是 Word 里面,方便写论文;其次,一个好的文献管理工具,要可以包含一篇论文足够多的信息,甚至包括论文的引用量这些指标,最好还可以为论文增加一些链接,到对应的 GitHub 项目等等。 Paperlib 是这样做到的 作为文献管理工具,Paperlib 的界面足够简单,无论是从界面,还是从使用上,都给我一种恰到好处的感觉,不会有冗余的东西,你一打开就是论文的主页面,它不会要求你登录,也 没有检查账户信息等扰人的提醒。这也是我最喜欢它的一点。由于采用的是 Electron 的框架,三个桌面端的界面也保持高度统一。它最强大的功能就是论文元数据的抓取,我们可以自定义不同的论文数据抓取源,针对论文的下载同样如此,你可以选择使用 arXiv,SemanticScholar,X-Hub 等工具来帮助你获取论文的 PDF 文件。 组织与管理 Paperlib 首页 这是 Paperlib 的首页,界面相当简单,左侧涵盖了自己的存储库与订阅库,库下面有依据不同的标签或者文件夹进行分类的论文;中间用来显示论文的信息,包括作者,年份,发表期刊或者会议,以及标题信息;顶部的搜索栏可以帮助我快速找到对应的论文;右侧栏有详细的论文信息,我可以给论文以评分,为它添加对应的 code 来源(一般是 Paperlib 自动抓取),也可以修改 Paperlib 抓取到的 PDF 文件。右键论文,可以进行论文数据的编辑,添加 Flag 等。而在右上方,我可以调整对应的预览视图,选择以 List、Table 或者其他方式,也有一些快速对论文进行操作的快捷键,像是删除、修改、添加 Flag 等。 在 Paperlib 里面添加论文可以有多种选择, 你可以直接将你的 PDF 文件拖入到 Paperlib 的主视图,Paperlib 会根据你自定义的元数据抓取器自动给论文配置好对应的信息。PDF 解析可能存在问题,因此这是我用的比较少的一种方法。 Paperlib 提供了浏览器扩展,我们可以在浏览论文的界面,直接点击 Paperlib 的图标,对应的论文就会加入到文献管理工具中。Paperlib 的扩展同样没有任何多余的存在,只是一个图标,你一点击,就自动添加论文。这在 arXiv 的网页上极其好用。 浏览器插件对于一些论文网页的支持还存在问题,例如像是科学指引 Science Direct,即 Elsevier 论文数据库里面的对应期刊,使用第二种方法添加就有可能失败。你也可以在 Google Scholar 中直接点击 Add to Paperlib,这也是我目前使用的最频繁的添加方式,绝对不会出错,配合 Google Scholar 的浏览器插件,在任何一个论文页面,点击 Google Scholar 的插件,来到谷歌学术网页,都能完成添加。 而如果添加的论文抓取不到对应的 PDF 文件,你可以直接拖 PDF 文件到 Paperlib 中。 预览与阅读 在 Paperlib 里面,它不提供内置的阅读器,而是依赖于电脑上现有的 PDF 阅读软件,你可以自定义点击文件后以何种应用打开,然后在对应的软件里面对 PDF 进行阅读和批注。你可以将你的批注、用其他软件写下的论文阅读笔记拖入到 Paperlib 中,自动保存。正如我在前面提到的拖入 PDF 文件一样,在替换文件右边的入口,就是将我们的笔记添加到论文上的一种方法。 但是如果你只是想快速预览论文,你可以按空格键,打开 PDF 文件的快速预览。 发现新论文 和 Mendeley 每周给你发一封邮件告诉你哪些论文与你最近阅读有关这种方式不同,也与 ReadCube Papers 内置的推荐系统不同,Paperlib 完全依靠用户的自定义。它为我们带来了一个订阅阅读器,这意味着可以我们自由订阅来自不同的期刊、arXiv 上的与自己研究课题相关的论文。这里我简单的举个例子关于我自己的一些订阅。 例如这个 Feed 链接:https://export.arxiv.org/api/query?search_query=cat:cs.CV+…… https://export.arxiv.org/api/query?search_query =cat:cs.CV+AND+abs:splicing+AND+abs:image+AND+abs:localization&start=0 &max_results=30&sortBy=submittedDate&sortOrder=descending 如你所见,在这个链接里面,我们在 search_query 中对一些项目进行了自定义的指定,首先是 cat:cs.CV 这就表示我们将 arXiv 上面的论文的 Subject Category 指定为 计算机科学下面的计算机视觉领域;同时,我们可以看到后面还添加了更多的查询变量控制,包括像 abs, sortBy 等等查询变量。 abs 代表的是摘要,我希望给我的 arXiv 论文里面,摘要要包括这个关键词,如果有更多的关键词,我们用 AND 进行连接。最后是,我希望给我的查询结果控制在 30 条就可以,结果的排序必须是按照提交的日期来排序,这就意味着,arXiv 会给你最新的符合你的查询限制的论文。 在这里我也给出 arXiv 上关于如何自定义自己的 Feed 的相关资料 arXiv User Manual search query: https://info.arxiv.org/help/api/user-manual.html#search_query_and_id_list Appendices: https://info.arxiv.org/help/api/user-manual.html#5-appendices Subject: https://arxiv.org/category_taxonomy sort: https://info.arxiv.org/help/api/user-manual.html#sort 除了订阅 arXiv 上面的论文,我们还可以订阅期刊的论文,期刊的订阅链接通常在它们期刊的官网给出,例如在这里,我订阅了有像 ACM TOG,IJCV,IEEE TIP,IEEE TMM,JMLR,IEEE TIFS 等期刊的论文。同时,在你的 Feeds 里面,你可以再次使用搜索,来找到符合自己需要的文献。 大部分的期刊,都会提供对应的订阅源,用户可以根据自己需要订阅不同的期刊。 多平台同步 对于应用数据的同步,作者给出了使用 MangoDB 的教程,我们跟着教程走,就可以在自己的多台桌面端设备上,完成这些论文数据的同步,包括标签信息,文件夹信息,论文信息,自己的配置信息等。 但是对于 PDF 文件的同步,我使用的是坚果云,因为坚果云支持多个平台,包括 Linux;Paperlib 也提供了 WebDAV 的功能,来同步不同设备之间的文件。 就我目前的使用情况 (200 多篇论文)来说,坚果云足够实现多个平台的 PDF 文件同步,但随着论文数量的上升,存储空间也会受到坚果云的限制,所以我也在考虑使用其他的云服务来实现多平台同步。 信息与引用 我很喜欢 Paperlib 提供的快速复制粘贴插件。我是使用 LaTeX 来写论文的,将论文放到 reference 里面很方便。而对使用 Microsoft Word 写论文的需求,对应的扩展也在公测当中。 只需要点击CMD/CTRL+SHIFT+I, 搜索选择一个论文按 Enter 或者 SHIFT + Enter 来复制 BibTex 或者 BibTex 键值。你可以把插件链接到一个组,该组将会存放你所有复制的论文。当你完成写作之后,你可以一次性复制这个组的所有 BibTex 字符串。 一个理想的写作流程是:1)首先将插件链接到一个组,2)写作过程中不断搜索,复制 BibTex 键值到你的 LaTex 文件中,3)写作完成,打开插件,复制全部 BibTex 到 .bib 文件中。 Paperlib 在丰富论文信息上,给我们提供了一个添加 GitHub 项目的入口,同时 Paperlib 也会自动寻找对应的 GitHub 项目来匹配对应的文献。 VS Others 除了 Paperlib,我用过的文献管理工具包括 EndNote,Mendeley,ReadCube Papers,ReadPaper。我最早接触到文献管理这个概念就是在 EndNote 里面,当时我们学校购买了 EndNote 的某一个版本给学生使用,从学校图书馆的公众号里面了解到一个介绍如何使用 EndNote 的活动,出于尝鲜的目的,我把它下载下来使用了一会儿,直到写我的本科毕业论文之前,我都是用 EndNote 放着不多不少的几篇论文。所以使用上其实不算深入,我一直觉得 EndNote 有一定的入门门槛,功能太多,我刚接触甚至不太知道从何处入手。 直到后面我发现了 Mendeley,它完全伴随着我的本科论文到研究生一年级的整个阶段,我还专门为 Mendeley 分享了一期我使用它的 视频,当时的 Mendeley 是支持全平台的,我可以在手机上随时检查我的论文,电脑的客户端采用的是应用程序的开发设计,而不是现在的 Manger 所采用的 Web 形式。 随着 Mendeley 放弃了之前的 Desktop 版本,我也刚好发现了 ReadCube Papers,果断地从 Mendeley 转移。ReadCube Papers 目前仍然是我非常喜欢的一款软件,我订阅了它一年,在这一年里,我的使用频率也相当高,体验也很好。当时一年期限到了,我犹豫要不要续期的时候,信用卡已经把钱扣了,但我又看到了 ReadPaper 这款产品,自己也面临毕业,所以就在想取消订阅,ReadCube Papers 也相当人性化,我给他们一封邮件,就把扣的钱退回来了。 于是又开始了 ReadPaper 的使用历程,ReadPaper 很不错的是 PDF 标注,以及记笔记的功能,但它更不像是帮助我管理,更像帮助我读论文,但是读论文的工具明显有更好的选择。直到某天我在 GitHub Feeds 里面,看到有朋友 Star 了这个项目,我一下载,安装,这就是我想要的工具。 下面我会简单介绍一下,前面几款工具的特点,由于 EndNote 我没有深入使用,所以暂时不作特别的评论。 Mendeley Mendeley 主页 其实 Mendeley 对我来说,使用那段时间,也离现在比较远了,因此对它的印象可能还是两三年前的 Mendeley。不可否认它带给过我惊艳的感受,在随着更加符合我使用习惯的工具出现后,我对 Mendeley 甚至还有了一些些不满,这些不满大多是,文献的组织和管理总是滞后显示,给我一种力不从心的感受;除此之外,是当时它可以把 PDF 文件拖入到软件界面来自动添加论文,但往往需要你对文件以合适的文件名命名,还要是期刊类的英文文献,才能有好的效果。 在更新之前,是全平台都支持的 Mendeley Desktop,更新之后是 Mendeley Reference Manager for Desktop,虽然是应用程序,但是使用体验却和网页差不太,给我感觉甚至就像是用 Mendeley 内置浏览器打开的味道。现在支持的平台也仅限三大桌面端。 和所有文献管理工具一样,Mendeley 提供了浏览器插件,Word 插件来帮助你添加论文和写论文;Mendeley 本身也提供了论文的同步,也可以从 PDF 文件里面提取到对应的论文数据,例如期刊,作者,年份等信息。 正如前面提到的,即便是桌面端,和网页版没有任何区别,一点开就是 Elsevier 的登录界面,当网页受到影响,桌面端是完全不能使用的,网页类带来的效果就是这个工具不像是工具,各种处理,都会变得比较滞后。 ReadCube Papers ReadCube Papers 网页主页,其客户端也采用同样的布局 这个软件目前仍然是我最喜欢的一个,Paperlib 和它的界面甚至都很像,当然大部分文献管理工具通常都是这样的布局。 全平台支持(Android, iOS, iPadOS, macOS, Windows, Web, SmartCite (Word, Google Docs), Browser Extension (Chrome, Firefox, Safari, Edge)) 推荐机制,Papers 根据内置的推荐算法,会为你推荐你的论文库里面相关的论文,缺点是大多数为期刊论文,arXiv 以及各种会议论文比较少。 自动下载,在 Papers 里面,你可以配置自己学校图书馆的代理信息,如果你就处于校园,它会为你自动下载学校已经购买的数据库的论文 PDF 文件,例如像是 IEEE Xplore 或者 ACM Digital Library 等收费数据库的论文原文。 全平台自动云同步,在 Papers 里面,你不需要考虑像 Zotero、Paperlib 或者其他工具提供有限容量等,要连接像坚果云,Dropbox 类似的云服务这个问题,Papers 直接为你提供了无限的云存储空间。 简单的笔记功能,PDF 的批注目前仍然不够好,很大程度上,这也是我放弃它的一个原因。Papers 提供了内置的论文阅读,有基础的 PDF 批注功能,可以使用高亮,下划线,删除线,添加笔记以及手写,这几种选择。但是 Papers 的手写体验是很糟糕的,甚至要比 ReadPaper 的体验还差,一部分原因我想可能是 Papers 没有像 ReadPaper 一样,对论文进行全文的抽取,将文本彻底放到一个新的层次上进行处理,所以无论是高亮,还是划线,常常比较难选中。但是 Papers 同样做到了可以提取参考文献,在侧边栏显示参考文献等信息,而不需要你滑到最下面。 内置的搜索,这对我来说不是文献管理工具的刚需,尽管内置的搜索可以像 Google Scholar 一样,提供尽可能详细的数据,但是我搜索论文一般不会专门到文献管理工具里面去搜索论文。 ReadPaper ReadPaper 主页 社区文化突出,一开始的全文翻译、相似论文等功能还需要分享给其他新用户才能解锁,然后文献管理的界面我觉得显示的内容太少了,很多信息的排版其实可以以更紧凑的方式呈现。 可以加好友,加入不同的学习组别,和自己的朋友一起读论文,社区味道比较浓,我们可以在学术社区里面找到自己的论文,也可以和朋友一起读,有问题直接提出,等待其他用户的解答。 有 Windows,macOS,以及 iPad 三个平台的支持。 内置阅读器,对论文进行了信息提取,我们可以快速进行论文翻译,选择不同的翻译服务;同时图表自动被提取,参考文献也能一键定位,也支持手写笔记(仅 iPad),和添加键盘输入的文字笔记;也可以修改颜色模式,即黑底白字等。 有一个 ReadPaper 小程序,可以提供最新的 arXiv 订阅,订阅的方式是从一些列举出来的领域里面进行选择,小程序可以看到论文标题,作者和摘要信息,但是没有原文的链接。 文献管理上,表格会根据内容自动选择行高,有文件夹,嵌套文件夹,标签,等等。 Paperlib 的缺点 可能有一些用户希望加入 PDF 批注编辑的功能,或者是觉得当前支持的会议或者期刊不够丰富,以及其他的一些需求;对我来说,这些还暂时算不上 Paperlib 作为一个面向计算机学科的文献管理工具的缺点。我在使用 Paperlib 的过程中觉得可以被列为缺点的内容如下: 不支持多平台,例如我想在手机上查看我的论文的时候,就没有办法;作者也提到他没有 Apple Developer 的账号,同时只有作者自己一个人在开发和维护,面对学业也有点精力不足。 没有推荐机制,正如我在前面提到的 ReadCube Papers,我很喜欢它的一点,就是推荐;但其实在 Paperlib 里面,推荐机制这一点也可以很好的用 Feed 里面的 RSS 订阅来解决。更好的方式或许可以从自己订阅的 Feed 里面,软件会根据推荐算法,论文的标题,摘要,作者等信息里面为你进行粗糙的论文推荐。 当然,这是一款开源软件,free 的意思,不仅仅代表免费,更意味着我们都可以自由地对它进行更改,设计成我们自己喜欢的样子。 你更喜欢 ReadCube Papers,ReadPaper 还是 Paperlib 呢,其实我觉得他们都是相当出色的工具,正如我一开始提到的,很多时候就是自己的喜好,或者说第一印象的问题。无论如何,欢迎大家推荐自己正在使用的工具。 本文首发于少数派,Paperlib 找到文献管理舒服的姿势 - 少数派 (sspai.com)

2023/7/19
articleCard.readMore