CDN加速镜像 | 设为首页 | 加入收藏夹
当前位置: 首页 资源下载 文档资料 搜索资源 - 文本 检索

搜索资源列表

  1. knn

    1下载:
  2. 朴素贝叶斯(Naive Bayes, NB)算法是机器学习领域中常用的一种基于概率的分类算法,非常简单有效。k近邻法(k-Nearest Neighbor, kNN)[30,31]又称为基于实例(Example-based, Instance-bases)的算法,其基本思想相当直观:Rocchio法来源于信息检索系统,后来最早由Hull在1994年应用于分类[74],从那以后,Rocchio方法就在文本分类中广泛应用起来。
  3. 所属分类:软件工程

    • 发布日期:2008-10-13
    • 文件大小:94.35kb
    • 提供者:许梁
  1. 200505243

    0下载:
  2. 音频针对音频检索任务中的关键词检索提出一种新的基于拼音图的两阶段检索系统,可以高效地从大量语音数据中检索出感兴趣的文本信息,从而达到为国家安全服务的目
  3. 所属分类:软件工程

    • 发布日期:2008-10-13
    • 文件大小:2.12mb
    • 提供者:zxj
  1. 网上信息抽取技术纵览

    0下载:
  2. 介绍信息抽取领域的发展。第2.1.节比较了信息抽取和信息检索的区别;第2.2.节介绍IE的历史。接下来两节解释评价IE系统的指标和常用的两派技术方法。信息抽取技术所处理的文本类型将在第2.5.节中说明。第2.6.节描述信息抽取技术可利用的网页特征。
  3. 所属分类:文档资料

  1. 基于XML的多媒体信息检索的研究

    0下载:
  2. 因特网的飞速发展与多媒体信息的广泛应用极大地改变了人们获取多媒体信息的方式和手段。各种多媒体信息检索系统已逐渐成为各类用户获取多媒体的主要工具,但是目前的两种多媒体检索方法—基于文本的多媒体信息检索和基于内容的多媒体信息检索,二者有固有的缺点,表现为:基于文本的多媒体检索,利用文本对多媒体进行描述,容易引起信息失真等缺陷。而基于内容的多媒体检索,在多媒体信息内容的描述、特征的自动提取、多媒体的同步技术、匹配和结构化的选择等方面具有问题。这些问题的出现导致多媒体检索系统的检索效果往往不能尽如人意,
  3. 所属分类:报告论文

    • 发布日期:2010-06-21
    • 文件大小:2.79mb
    • 提供者:ymwjnu@qq.com
  1. javaNIO

    0下载:
  2. 一系列缓冲区类支撑起了 Java 2 平台标准版的新 I/O(NIO)包。这些类的数据容器形成了其它 NIO 操作(如套接字通道上的非阻塞读取)的基础。在本月的 Merlin 的魔力中,常驻 Java 编程专家 John Zukowski 展示了如何操作那些数据缓冲区来执行如读/写原语这样的任务以及如何使用内存映射文件。在以后的文章里,他将把这里所提到的概念扩展到套接字通道的使用。 Java 2 平台标准版(Java 2 Platform Standard Edition,J2SE)1.4 对
  3. 所属分类:文档资料

  1. Lucene简介

    0下载:
  2. Lucene是apache软件基金会[4] jakarta项目组的一个子项目,是一个开放源代码[5]的全文检索引擎工具包,即它不是一个完整的全文检索引擎,而是一个全文检索引擎的架构,提供了完整的查询引擎和索引引擎,部分文本分析引擎(英文与德文两种西方语言)。Lucene的目的是为软件开发人员提供一个简单易用的工具包,以方便的在目标系统中实现全文检索的功能,或者是以此为基础建立起完整的全文检索引擎。
  3. 所属分类:文档资料

    • 发布日期:2014-01-10
    • 文件大小:44.5kb
    • 提供者:hapasy
  1. 关于linux下文件编译的方法

    0下载:
  2. 摘 要: 本文主要阐述了关于linux下文件编译的方法以及vim编辑器的配置,并介绍了linux下热门开发工具。 关 键 词: vim配置与使用;linux文件编译;linux下热门开发工具 引 言: 1.一般拿到新的服务器都需要自己配置一下vim的环境,要不觉得总是不是很顺手。本文介绍了vim的基本配置以及一些个性化配置,用户可根据自己喜好及习惯自由配置;2.介绍了Linux文本编译的常用编译命令选项和多源文件编译方法,使读者对linux下文件编译有一个直观的了解;3.介绍了常用linux下开
  3. 所属分类:文档资料

  1. LJDBSearch(1)

    0下载:
  2. 数据库管理系统存储的一般都是结构化数据,长足于数值的计算、查询、统计与挖掘。随着计算机存储与计算能力的迅猛发展,越来越多的非结构化文本数据存储在数据库中,数据库中的文本搜索日益广泛。 当前,数据库中的文本搜索,一般采用SQL语句中的Like操作符或者采用数据库系统自带的全文索引功能。Like操作往往特别耗时,数据规模超过10万条,查询往往会导致网络连接超时,无法满足在线搜索的需要;同时,Like查询仅仅是简单的字符串匹配,没有考虑语言语义,检索“和服”,同样会命中“产品和服务”。当前
  3. 所属分类:software engineering

    • 发布日期:2017-05-04
    • 文件大小:1.37mb
    • 提供者:lingjoin
  1. jiansuo

    0下载:
  2. 关于检索方面的资料,包括文本检索的统计语言建模方法综述,现代信息检索第1章[1]-On the retrieval of information, including text retrieval of statistical language modeling methods, Modern Information Retrieval Chapter 1 [1]
  3. 所属分类:File Formats

    • 发布日期:2017-03-29
    • 文件大小:679.57kb
    • 提供者:xsz
  1. InformationRetrieval

    0下载:
  2. 关于信息检索技术的说明和文本聚类简介,介绍了几种主要文本聚类算法-Introduction to Information Retrieval and Text Clustering
  3. 所属分类:Communication

    • 发布日期:2017-03-30
    • 文件大小:183.89kb
    • 提供者:lyhadong
  1. 12

    0下载:
  2. 而一个搜索引擎友好的个人网站,应该方便搜索引擎检索信息,并且返回的检索信息让用户看起来有吸引力,这样才能达到搜索引擎营销的目的。为了说明什么是网站对搜索引擎友好,我们不妨看看对搜索引擎不友好的网站有哪些特征: (1)个人主页中大量采用图片或者Flash等Rich Media形式,没有可以检索文本信息是搜索引擎无法有效的自己名字进行抓取收录。 -Kirin enterprise ( Hongkong) Limited company is a specialized in forei
  3. 所属分类:Project Design

  1. Text-Retrieval

    0下载:
  2. 信息检索系统从最初的纯手工检索系统业已发展到现在的以信息技术为支撑的检索系统,在这一过程中,适应新的信息资源、信息技术这些检索环境,提高信息检索系统的查全率、查准率和系统响应时间是不变的主题,在众多文本中掌握最有效的信息始终是信息处理的一大目标。围绕向量空间模型设计了一个文本检索系统,介绍向量空间模型的基础上给出了基于它的信息检索系统的一般结构框架和各部分的功能,探讨了系统中所涉及到的关键技术。用向量空间模型进行特征表达,用TF-IDF(Term-Frequency Inverse-Docume
  3. 所属分类:Project Design

    • 发布日期:2017-05-01
    • 文件大小:697.4kb
    • 提供者:Peng Jin
  1. cut-stopwords

    0下载:
  2. 语义网中,文本分析、信息检索常用的停用词!-The Semantic Web, text analysis, information retrieval used stop words!
  3. 所属分类:File Formats

    • 发布日期:2017-11-25
    • 文件大小:10.81kb
    • 提供者:陈芳
  1. JavaScript-Regular-expressions

    0下载:
  2. Javascr ipt中的正则表达式解析   正则表达式是个描述字符模式的对象。   Javascr ipt的RegExp对象和String对象定义了使用正则表达式来执行强大的模式匹配和文本检索和替换函数的方法. -The Javascr ipt regular expression parsing regular expressions is described in character-mode object. Javascr ipt RegExp object and the
  3. 所属分类:software engineering

    • 发布日期:2017-05-04
    • 文件大小:13.16kb
    • 提供者:吴清
  1. U201514766

    0下载:
  2. 基于查找表的单词检索软件,设计与实现静态查找表、基于二叉排序树的动态查找表及HASH表等三种中的任意两种查找表结构及其抽象数据类型;以一本英文电子书(如英文小说,科普读物或圣经之类的社会书籍,书的篇幅不少于2万次单词)作为单词文本数据来源,使用上述查找表ADT,通过读取电子书而建立对应的两种查找表,以单词作为关键字,单词在书籍中出现的次数及每次出现的页码,行号等信息作为查找表数据元素属性;通过理论与实际测试结果对比分析两种查找表性能。(The design and implementation
  3. 所属分类:软件工程

    • 发布日期:2018-01-07
    • 文件大小:14.1mb
    • 提供者:aliiiim
  1. stopwords

    0下载:
  2. 中文停用词表(停用词是指在信息检索中,为节省存储空间和提高搜索效率,在处理自然语言数据(或文本)之前或之后会自动过滤掉某些字或词,这些字或词即被称为Stop Words(停用词)。这些停用词都是人工输入、非自动化生成的,生成后的停用词会形成一个停用词表。)(Chinese Stop Words List)
  3. 所属分类:文章/文档

    • 发布日期:2018-04-29
    • 文件大小:6kb
    • 提供者:vtfghs
搜珍网 www.dssz.com