GeekPlux

GeekPlux

马上订阅 GeekPlux RSS 更新: https://geekplux.com/atom.xml

文本数据可视化(下)——一图胜千言

2017年6月26日 21:57

本文首发于:GraphiCon 知乎专栏-文本数据可视化(下)——一图胜千言。原文地址:https://geekplux.com/2017/06/26/text-data-visualization

文字是传递信息最常用的载体。在当前这个信息爆炸的时代,人们接收信息的速度已经小于信息产生的速度,尤其是文本信息。当大段大段的文字摆在面前,已经很少有耐心去认真把它读完,经常是先找文中的图片来看。这一方面说明人们对图形的接受程度比枯燥的文字要高很多,另一方面说明人们急需一种更高效的信息接收方式,文本可视化正是解药良方。「一图胜千言」我们从小就有体会,教材里的解释图、自己笔记里总结的知识结构图,一直到现在经常用的思维导图等,其实都是简单、实用的文本可视化。本文将简单介绍文本可视化的基础概念,然后重点通过各类文本可视化的案例来阐述可视化之美(多图,不过为了学到知识这点流量不算什么)。

为什么要文本数据可视化

虽然一般这种讲必要性的段落很多人都略过不看,虽然文本可视化的必要性大家用脚趾头估计都能想到,但我还是稍微说一说吧。文本可视化的作用有以下四点:

  1. 理解 - 理解主旨
  2. 组织 - 组织、分类信息
  3. 比较 - 对比文档信息
  4. 关联 - 关联文本的 pattern 和其他信息

简单来说就是让你更加直观迅速的获取、分析信息(所有可视化的作用都是这个)。举个例子,针对一篇文章,文本可视化能更快的告诉我们文章在讲什么;针对社交网络上的发言,文本可视化可以帮我们信息归类,情感分析;针对一个大新闻,文本可视化可以帮我们捋顺事情发展的脉络、每个人物的关系等等;针对一系列的文档,我们可以通过文本可视化来找到它们之间的联系等等。

一般来说,情报分析人员、网络内容分析人员、情感分析或文学研究者等相...

Continue to read