【计算机论文全套栏目提醒】:网学会员在计算机论文全套频道为大家收集整理了“一种网络下载频次规律分析方法 - 计算机教材“提供大家参考,希望对大家有所帮助!
一种网络下载频次规律分析方法数据库与信息管理 徐俊王晓芳 约2859字 摘要:该文提出一种网络下载频次规律分析方法通过信息的下载频次对网络信息进行研究选取CNKI数据库中有关网络信息计量的文献对其进行数据分析和图像验证得出网络信息计量仍然遵循文献计量经典规律布拉德福定律结论。
关键词:网络信息计量网络下载频次布拉德福定律 中图分类号:TP311文献标识码:A 文章编号:1009-3044201010-2307-02 One Method of Analyse Based on Web-download Frequency XU Jun1 WANG Xiao-fang2 1.Institute of Measurement and Test of AnhuiHefei 230051China2.Department of ComputerArtillery AcademyHefei 230031China Abstract: This paper puts forward One method of analyse based on Web-download frequency researching law of distribution in CNKI database through image verifyingthis paper points out that Bradford law is applicable to journals survey with some new features. Key words: Webmetrics Web-download Frequrncy Bradfordlaw 信息资源电子化、网络化以及网上文献信息数量激增促进了网络计量学学科的形成和发展。
其次电子文献信息资料的统计分析及研究成果为该学科的形成奠定了基础。
随着网上文献信息的日益增长信息计量学的研究对象和范围必然要随之开展到网络领域这是该学科发展的客观要求和必然趋势。
网络信息计量学的研究成果必然会为网络管理的定量化和学化提供理论指导和定量依据1。
评价科技论文的文献计量学指标有很多如论文发文数量、被引频次、高被引论文数、自引数、他引数、基金资助论文数、论文发表期刊的影响因子、不同排序作者对论文的贡献率、论文的合作人数、论文的参考文献数、论文被下载的次数等等。
该文选取其中论文被下载的次数为研究指标探讨文献计量指标的学术评价功能在网络计量学中的应用。
1 数据来源 海量的信息搜索具有一定难度并且网络信息的组织和描述没有完全规范和统一因此寻找网络信息计量学的样本很复杂。
由于SCI、EI收录的中文期刊数量很少 不能在统计学意义上给出我国期刊的计量指标。
为了具有代表性本文选择CNKI作为统计分析的样本数据将以“网络信息计量”作为主题词的CNKI数据库作为数据来源。
2 实证分析 Web下载总频次是该期刊上网以来所登载的全部文献在统计当年被下载包括全文浏览、转存和打印的总频次。
反映了该期刊在网络上的载体影响及被应用的能力。
本文数据选择时间间隔为2005年到2010年统计这期间“计量技术”专业相关论文信息在数据库中的平均数量。
共得到有中文“计量技术”作为主题的学术论文45篇按照“下载频次”的降序排列得到表1。
本文取不同的分区值对数据进行区域划分并分析计算如表1所示。
由表1中数据可知有下载频次的论文总数量N45。
全部45篇论文的“下载累计频次”AR455292我们取布拉德福分区数m为6来计算布拉德福常数amm8比较布拉德福图形并探寻其规律2。
通过对原始数据按照“网络下载总频次”的递减顺序进行等级排列当m6时共分6个区同理按照区域分析法3令每个区域文章下载总频次大致相等计算平均值为A/m5292/6882按照这一平均值计算各区域中的论文累计数Njj12??6得到区域划分的结果如表2所示。
计算得到均值a6 2.06 依据表2的分析结果当分区数m6时布拉德福常数范围为1-4.8平均值为2.06。
可以看出第四区的数目及常数偏大。
以上分析表明网络环境下用户对信息的利用规律与传统环境下基本一致数据分布仍具有一定的布拉德福分布特点但是在网络环境下表现得不明显并且有新的特点文献计量指标的学术评价功能在网络计量学中仍适用。
3 图像分析 以“Nj的自然对数LnNj”为横轴以“下载累计数Rnj”为纵轴以表2中的数据作曲线图得到数据分布图形如图1所示。
以“论文累计数nj”为X轴以“下载次数累计数Rnj”为Y轴以表2中的数据作曲线图如图2所示。
图1 m 为6时LnNjRnj数据分布图形图2m