网络信息资源的个性化服务
及成功案例
目录
网络信息资源个性化服务
网络信息资源个性化服务方式
网络信息资源个性化服务实现过程
数字图书馆个性化信息服务方式
数字图书馆个性化信息服务经典案例
案例介绍
网络信息资源开展个性化服务的必要性
——中国网站规模变化
个性化服务
网络信息资源个性化服务定义
• 个性化信息服务
就是基于信息用户的信息使用行为、习惯、
偏好和特点, 向用户提供满足其各种个性化需求的
一种服务.
个性化信息:
是反映个性化特征的一切信息,同时还包括
个体特定的信息需求组合。
网络信息资源个性化服务的特点
用户提出现有的需求——提供用户所需
要的信息
研究用户个性、习惯、知识结构、信息
需求……——预测和搜集用户可能感兴
趣的信息——提供信息、激活用户的潜
在信息需求
网络信息资源个性化服务的特点
服务方式的针对性
服务内容的针对性
网络信息资源个性化服务的特点
最大程度地了解用户对信息的明确需
求与潜在需求、当前需求与长远需求
个性化信息服务适应动态变化的个性
需求
网络信息资源个性化服务的特点
用户满意是个性化信息服务
的出发点和归宿点,面向用户的
个性化信息服务提高了信息需求
的满足度,速度更快、容量更大。
查全率和查准率得到很大的提高,
个性化信息服务对网络信息资源
进行自动化处理,使用户的需求
能够得到高效、准确、及时的反
馈。
2 网络信息资源个性化服务方式
分类定制是指信息用户可以按
照自己的目的和需求, 在某一特定
系统功能服务形式中, 自己设定信
息的资源类型、表现形式、选择特
定的系统服务功能等。通过分类定
制, 用户每次登录网站时, 只要键
入自己的用户名和密码, 服务器根
据用户信息数据库将查询结果主动
推送给信息用户, 并利用动态网页
生成用户定制的动态页面。
RSS订阅
2 网络信息资源个性化服务方式
智能代理技术很好的解决了用
户无法贴切、完全地表达出自己的
爱好、兴趣和需求的问题。它是一
种能够完成委托任务的智能计算机
系统, 能模仿人的行为执行一定的
任务, 不需要或很少需要用户的干
预和指导。智能化代理通过跟踪用
户在信息空间中的活动, 自动捕捉
用户的兴趣、爱好, 主动搜索可能
引起用户兴趣的信息并提供给用户。
2 网络信息资源个性化服务方式
协调过滤服务主要是把用户
的偏好与其他用户的偏好进行比
较, 建立偏好群体的描述, 然后
假定这个特定用户与这个同偏好
群体的需求相同,对其需求内容
进行推荐。
2 网络信息资源个性化服务方式
垂直门户是和综合性及水
平门户相对应的概念, 它通
过汇聚网上某一特定专题信
息资源, 并对其进行挖掘和
加工, 以满足用户基于专业
的深入的信息需求。
系统帮助用户修改检索提问式,
如当用户输入一个检索词, 系统就
会将检索词与内部词表中相关词进
行比较, 并在界面上显示各种与该
词有逻辑关联性的词组, 以供用户
选择。通过帮助用户选择更接近自
己检索目标的检索词来提高信息查
询效率。
2 网络信息资源个性化服务方式
信息呼叫中心主要利用电话、
传真等方式来服务客户, 处理简
单的呼叫流程。信息呼叫中心引
入客户关系管理, 建立客户数据
库, 对信息进行分析、处理、采
集和挖掘, 使呼叫中心可以得到
每个客户的详细信息, 由此为客
户提供一对一的个性化服务。
2 网络信息资源个性化服务方式
3 网络信息资源个性化服务实现过程
1.用户描述文件的
表达与更新
2.资源描述文件
的表达
3.个性化推荐
4.个性化服务
体系结构
用户描述文件的表达与更新
收集用户描述文件前应考虑问题:
① 有没有现成的标准?
② 收集什么数据?收集的数据用于什么目的?
③ 如何收集数据?根据什么信息源来收集?
④ 收集的数据如何组织?
⑤ 用户信息能否自适应地更新?
用户描述文件的表达与更新
可以表示为用户浏览
模式或访问模式
可以表示为加权矢量模型、类型
层次结构模型、加权语义网模型、
书签和目录结构等
用户描述文件的表达与更新
用户注册
基本信息
系统隐式收
集用户信息
用户描述
文件一
系统自适应修改
(显示跟踪、隐
式跟踪)
用户修改
用户描述
文件……
用户描述文件的表达与更新
系统可以要求用户反馈自己对推荐资源的喜好
程度。一般情况下,这种做法很难收到实效,因
为很少有用户向系统主动表达自己的喜好。
•行为跟踪.用户行为可以表现为查询、浏览页
面和文章、标记书签、反馈信息、点击鼠标、
拖动滚动条、前进、后退等等。文献的研究表
明,用户查询、访问页面、标记书签能有效揭示
用户的兴趣.
•日志挖掘,利用Web日志可以获得页面的点击次
数、页面停留时间和页面访问顺序等信息。通
过分析Web日志可以获得相关页面、相似用户群
体和用户访问模式等信息
用户描述文件的表达与更新
② 将用维变量
构建数据立方体
(URL、资源类
型、大小、时间
……)
① 首先清除日志中无关的信息,
将有效数据存放到数据库中
③ 进行在线分析
处理,通过对数据
立方体的切块和
切片,分析用户在
不同域的分布情
况,分析用户对资
源的使用情况等
等.④ 利用各种数
据挖掘方法来
预测、分类和
发现有意义的
关系
资源文件的表达
基于内容的方法是从资源本身抽取信息来表示资源,使用
最广泛的方法是用加权关键词矢量.对文档来说,关键的问题是
特征选取,特征选取要达到两个目标:一是选取最好的词;二是
选取的词最少.要抽取特征词条,需要对文档进行词的切分,在
切分的同时,利用停用词列表(stop word)从文档特征集中除去
停用词,在完成词切分后,接着除去文档集中出现次数过少和过
多的词.经过这些处理后,特征数目一般还很大,还需对特征进
行进一步的选取,以降低特征的维数.
在完成文档特征的选取后,还得计算每个特征的权值,使用
最广泛的是TFIDF方法,对某一特征,TF(term frequency)表示
该 特 征 在 文 档 中 出 现 的 次 数 ,IDF(inverse document
frequency)表示log(所有文档数/包含该特征的文档数).矢量
模型的代价是比较大的,有时为了加快处理速度,可以只考虑TF
一项,
资源文件的表达
基于分类的方法是利用类别来表示资源,对
文档资源进行分类有利于将文档推荐给对该类文
档感兴趣的用户.文本分类方法有多种,比如:朴
素贝叶斯(Naïe-Bayes),k最近邻方法(KNN)和支
持向量机(SVM)等。
资源的类别可以预先定义,也可以利用聚类
技术自动产生。许多研究表明:聚类的精度非常
依赖于文档的数量,而且由自动聚类产生的类型
可能对用户来说是毫无意义的,因此可以先使用
手工选定的类型来分类文档,在没有对应的候选
类型或需要进一步划分某类型时,才使用聚类产
生的类型。
个性化推荐
规则可以由用户定制,也可以利用基于关联规则的
挖掘技术来发现,利用规则来推荐信息依赖于规则的质
量和数量,基于规则的技术其缺点是随着规则的数量增
多,系统将变得越来越难以管理.一个规则本质上是一个
If-Then语句。
为了利用规则来推荐资源,用户描述文件和资源描
述文件需用相同的关键词集合来进行描述.
基于内容过滤的技术是通过比较资源与用户
描述文件来推荐资源,它的关键问题是相似度计
算,对于矢量空间模型来说,通常采用的方法是余
弦度量。如果用户的描述文件没有正确描述用户
的兴趣和行为,那么该方法推荐的数据可能和用
户真正的兴趣根本不相关。
优点:是简单、有效
缺点:难以区分资源内容的品质和风格,而且不
能为用户发现新的感兴趣的资源,只能发现和用
户已有兴趣相似的资源。
个性化推荐
个性化推荐
个性化服务体系结构
优点是可以避免用
户描述文件的传输,
除了支持基于内容
的过滤,还可以支
持协作过滤
缺点是用户描述文
件不能在不同的
Web应用之间共享
Syskill,Letizia,
GroupLens
优点是用户描述文
件可以在不同的应
用之间共享
缺点是只能进行基
于内容的过滤
优点是不仅可以支
持基于内容的过滤
和协作过滤,还支
持用户描述文件在
不同Web应用之间
的共享
缺点是可能需要传
输用户描述文件.
个性化服务体系结构
案例一 个性化服务系统 ILOG
案例二 个性化服务系统
Personal WebWatcher
案例三 个性化服务系统 GroupLens
案例四
第一,信息量大,需要对海量信息进行搜索、存储和智能管理。
文字信息,从1948年以来新华社播发的所有中文电讯稿3000余
万篇,每天新增各种精选稿件10000多篇。200多万张图片涉及
国内外政治、经济、文化、体育、教育及风土人情等,而且每
日增加1600多张。国内外多个领域,集新闻性与艺术性于一体
的图表近万张,每天递增最新的国内国际图表新闻10多张。音、
视频信息近万小时。
第二,信息形式多,需要提供统一、跨媒体检索。不但包括
文字、图片、图表和视频等多种形式的信息资源,而且涵盖了
中文、英文、法文、西文、俄文等10多种语言信息资源。
第三,服务人群多,需提供个性化服务。新华社多媒体数据
库搜索引擎不仅面向内部用户,还面向许多类型外部用户,例
如为媒体用户提供大量丰富、前沿、精彩的各类新闻,作为编
写稿件的权威参考等。
新华社多媒体数据库特点:
案例五:QQ空间的RSS订阅
方式一:直接输入订阅网址
方式二:通过推荐订阅 方式四:通过好友推荐
方式三:通过热文排行
案例五:QQ空间的RSS订阅
案例六:
Page 45
数字图书馆个性化信息服务
信息
个性化
服务
个性化
个性化
信息服
务
数字图书馆拥有海量的信息,而用户要在如此海
量的信息中挖掘出有用的或自己感兴趣的资料非
常困难。因此,用户获得信息的主要障碍已转变
为选择上的障碍。这种用户需求的转变催生了个
性化信息服务的提出。
Page 46
国内外数字图书馆个性化信息服务现状
Page 47
1 数字图书馆个性化信息服务
个性化内容定制服务
个性化内容定制服务主要指用户根据自己的需求和目的,向
某一特定的系统提交自己的检索界面、偏好资源、系统服务
等信息。它通过获取用户个性化信息,为用户提供更为准确
满意的信息服务,因而成为了数字图书馆个性化信息服务的
最主要方式。
1 • 用户注册,并把定制信息提交给数据库
2 • 系统自动跟踪用户行为,分析其偏好并将信息存入用户信息数据库
3 • 系统处理用户信息,提供符合用户需求的信息
4
• 用户反馈,系统根据反馈信息修改用户信息数据库内容
Page 48
个性化内容定制服务范例
人大个性化
信息服务
系统
MyLibrary@NCStatc
系统
MyLibrary@Concll
系统
ILAS系统下的
“我的图书馆”
子系统
MyLibrary@HUST
系统
Page 49
个性化内容定制服务范例(深圳图书馆)
深圳图书馆的ILAS系统
Page 50
个性化信息推送服务
推送技术通过自
动传送信息给用
户,来减少用于
网络上搜索的时
间。它根据用户
的兴趣来搜索、
过滤信息,并将
其定期推给用户,
帮助用户高效率
地发掘有价值的
信息。
推送推送
服务服务
信息
定题
最新资最新资
料快报料快报
智能化
推荐
Page 51
最新资料快报
通过推送技术开展最新资料快报服务,也就是信息服
务机构在动态收集用户信息行为或用户定制基础上,
建立用户信息需求模型,及时将符合用户兴趣的最新
资料推送给用户。
中国科学院上
海文献情报中
心图书馆
目次信息推送
系统
新书信息推送
系统
带有分类选择
功能的新书信
息推送系统
Page 52
最新资料快报(UnCover数据库)
Page 53
信息定题
信息定题服务是利用网络推送技术,信息服务机构
可为特约信息需求用户群体长期或定期推送定向式、
跟踪式的专题信息服务。
Page 54
智能化推荐
智能化推荐服务不仅能根据用户的特征提供具有针
对性的信息,还能通过对用户专业特征、研究兴趣
的智能分析而主动向用户推荐其可能需要的信息。
经典范例
美国卡罗来
纳大学图书
馆的
ilumine系
统
中国人民大
学的“数字
图书馆个性
化推荐系统
”
Page 55
智能化推荐范例(中国人民大学图书馆)
Page 56
个性化信息推送服务的方式
频道
式
邮件
式
信息
推送
Page 57
个性化信息咨询服务
个性化信息咨询是一种以人力资源为媒介、以因特网为基础
而提供的信息服务。咨询的方式可通过提供多层次的咨询服
务接口,实现用户与虚拟咨询员的在线或离线讨论。
通过填写系统中
的表单向参考咨
询馆员提问
在咨询参考咨询
馆员之前,先查
阅常见问题解答
库中有没有相关
解答
通过QQ、MSN或
者系统自带的
实时交流软件
向参考咨询馆
员当面提问
FAQ
表单
咨询
实时
咨询
Page 58
个性化信息咨询服务范例(联合参考咨询网)
Page 59
个性化信息咨询服务范例(联合参考咨询网)
Page 60
个性化信息咨询服务范例(联合参考咨询网)
Page 61
个性化信息咨询服务范例(网上联合知识导航站)
Page 62
个性化信息咨询服务范例(Ask a Librarian)
Page 63
学科服务
学科馆员是指图书馆设专人与某一个院系或学科专业作为
对口单位建立联系,在院系、学科专业与图书馆之间架起
一座桥梁,相互沟通,为用户主动地有针对性地收集、提
供文献信息服务。
学科导航站是利用数据库系统结合超文本技术,对因特网
上与某一学科相关的国内外科研状况、电子出版物、学术
机构组织、学者个人站点、网络数据库、专利标准、科技
成果以及专业搜索引擎等信息资源节点加以集中、分类、
整理,按照方便用户利用的原则,以主题树的形式揭示资
源的分布情况,同时提供关键词检索途径。
Page 64
学科服务范例(清华大学图书馆)
Page 65
学科服务范例(清华大学图书馆)
Page 66
2 经典案例(中国科学院国家科学图书馆)
Page 67
2 经典案例(中国科学院国家科学图书馆)
问图书馆员
论文收引检
索及评价
定题、专题
信息服务
科技查新
我的图书馆
网络信息资
源导航
学科馆员服
务
科技新闻聚
合服务
中
国
科
学
院
国
家
图
书
馆
个
性
化
信
息
服
务
项
目
Page 68
问图书馆员
Page 69
问图书馆员
Page 70
论文收引检索及评价
国科图为用户在申报院士、国家自然科学基金、职称评定等方面提供机构
或个人的论文收录引用检索服务。除查询SCI、EI、ISTP三大检索数据库
外,还可查询 INSPEC(SA)、CA、MEDLINE、BP(BA)、
MATHSCI、GEOREF等国际著名检索数据库。根据检索结果,为用户提
供客观、 准确、权威的论文收录引用检索证明。
Page 71
定题、专题信息服务
Page 72
科技查新
Page 73
我的图书馆
Page 74
网络信息资源导航
Page 75
网络信息资源导航
Page 76
网络信息资源导航
Page 77
网络信息资源导航
Page 78
网络信息资源导航
Page 79
学科馆员服务
Page 80
科技新闻聚合服务
谢 谢 大 家!