标签(Tags)可视化呈现

标签被人们广泛应用到分类和组织网络内容如书签、博文或照片。标签是类似于形式自由的关键词,被用来作为元数据添加到资源对象上。在多数标签系统中,一个资源对象可被添加一个或多个关键词,这导致了资源对象被分配到多个类目下。比如,一个站点可能被贴上“博客”、“可视化”和“设计”。随着越来越多的资源对象被添加标签,标签索引的数量越来越大,也变得更复杂。如何高效地在海量标签中查找到符合自身需要的资源成为人们关注的普遍问题,适当的标签索引展现形式能够帮助用户检索和浏览资源集。

可视化是一种很有前景的方法。过去的可视化技术用来展示具有层次结构的关键词或类别。标签索引的一个显著特征就是非层次机构、平面的。HubBlog尝试将del.icio.us标签用复杂的网络图表示,而这种网络图却难以理解。

Revealicious提供了三种方式可视化del.icio.us标签,以帮助用户检索和选择标签,其中Spacenav将标签以无限二维空间表示,每个标签用圆形表示,圆的直径表示使用频率,圆形之间的距离代表关联度,该方法可以反映标签之间的关系,但只能选择性地展示一部分标签,不利于用户对标签索引的宏观认识。

标签云图(Tag-Cloud,或加权列表)作为可视化信息检索界面模型在Tagging-based系统中得到普遍应用。在此模型中,使用频率高的tag以字母顺序或者数量大小排列,伴以标签颜色的深浅和字体大小表示受欢迎程度。它最大的特点是简洁小巧,不过是以牺牲其他重要信息为代价的,如标签之间的关系。

Marti A. Hearst(2008)认为好的图形设计可以引导观察者的眼睛完成浏览,提供直觉上的观察起始点和潜在视觉转移路线。但在观察标签云图时,眼睛倾向于停留在大的标签上,并以不确定的路径快速移开,直到发现下一个大的标签,在移动过程中可能会对中等大小的标签一扫而过,更小的标签则以令人焦躁不安的速度闪过。在可视化视图中,物理距离是表示描述对象之间关系的重要视觉效果,但是在标签云图中,由于标签是按字母顺序排列,语义相近的标签不一定彼此相邻。此外,标签云图也不易看出一个主题的标签集。

Halvey和Keane(2007)通过考察标签的排列方式、字体大小与标签位置等因素对用户完成任务的影响,发现标签按照字母顺序排列的简单列表比标签云图更有利于用户快速找到信息,用户是以快速浏览(scan)而不是逐词阅读的模式使用标签云图[ ]。可见,标签云图适合用于帮助用户快速了解标签的使用频率,发现流行话题,而以字顺排列的标签列表更适合用户浏览式检索资源。

Yusef Hassan-Monteroa和Víctor Herrero-SolanaaImproving对上述标签显示方法做了改善,将聚类算法运用到可视化布局中,将语义相关的标签在一行内显示,该方法可降低标签集的语义密度,并提高标签云图布局的视觉连贯性,以提高浏览体验。

标签云图的另一种形式是基于时间的tagline,可以发现不同时间段内最受关注的主题(即标签)。雅虎研究员根据Flickr标签信息开发的taglines, 前端展现上采取两种显示模式:横向河流模式和纵向瀑布模式。顶部的时间轴上显示出当前的时间段(默认时间单位是一天),可以通过鼠标拖动时间轴上的指针到特定的日期。标签字体大小代表了它的受关注程度,每个标签下面或右侧Flickr上与此标签对应的一张或多张照片,单击标签会显示更多相关照片。此种显示方法最大的挑战是如何高效的从大量的数据中,实时计算和展现最受关注的标签。

鉴于现有的可视化技术大都借助于难以理解的网络图展现标签或者只聚焦标签集合中小部分子集。IBM研究员Bernard Kerr介绍了一种技术可以一次性展现整个索引,使用户可以对标签索引整体上了解,同时显示单独标签和项目的详细内容—TagOrbitals。主标签被放置在一个同心圆的中心,与主标签一起使用的其他标签则放置在周围的轨道或带上,第一个轨道上显示的是与主标签单独共同使用的标签,第二个轨道上是与主标签一起使用的标签对,以此类推。每个书签(bookmark)的标题径向显示在每个轨道上标签集的旁边,这样就达到将具有相同标签集的书签聚为一类。在标签云图中,标签环(TagOrbital)的直径根据主标签的使用次数按比例缩放。

发表评论