搜索资源列表
hadoop-0.7.1.tar
- hadoop:Nutch集群平台,分布式编程模式,让Nutch可以自动在普通机器组成的集群中以并行方式分布执行-hadoop : Cluster Nutch software platform, distributed programming model, Let Nutch software can be automatically composed of general machinery cluster parallel to the implementation of distribut
hdfs-over-ftp-hadoop-0.20.0
- 在hadoop分布式文件系统上实现ftp 服务-Hadoop distributed file system in the ftp services to achieve
hadoop-0.1.0.tar
- Hadoop是一个用于运行应用程序在大型集群的廉价硬件设备上的框架。Hadoop为应用程序透明的提供了一组稳定/可靠的接口和数据运动。在 Hadoop中实现了Google的MapReduce算法,它能够把应用程序分割成许多很小的工作单元,每个单元可以在任何集群节点上执行或重复执行。此外,Hadoop还提供一个分布式文件系统用来在各个计算节点上存储数据,并提供了对数据读写的高吞吐率。由于应用了map/reduce和分布式文件系统使得Hadoop框架具有高容错性,它会自动处理失败节点。已经在具有60
hypertable-0.9.2.4-alpha-src.tar
- Hadoop和分布式数据库 Hadoop和分布式数据库 -Hadoop和分布式数据库 Hadoop和分布式数据库 Hadoop和分布式数据库 Hadoop和分布式数据库
hadoop-0.20.0.tar
- Hadoop 是一个实现了 MapReduce 计算模型的开源分布式并行编程框架,借助于 Hadoop, 程序员可以轻松地编写分布式并行程序,将其运行于计算机集群上,完成海量数据的计算。-Hadoop is an implementation of the MapReduce computation model of the open-source framework for distributed parallel programming, through the use of Hadoop,
kfs-0.3.tar
- 来自startup的垂直搜索引擎http://www.kosmix.com/的开源项目,又一个开源的类似google mapreduce 的分布式文件系统,可以应用在诸如图片存储、搜索引擎、网格计算、数据挖掘这样需要处理大数据量的网络应用中。与hadoop集成得也比较好,这样可以充分利用了hadoop一些现成的功能,基于C++。-Applications that process large volumes of data (such as, search engines, grid compu
phoenix_wordcount.tar
- mapreduce算法的phoenix架构实现和一个使用实例,用mapreduce算法对一个输入的文本文件中的单词计数。-mapreduce algorithm phoenix architecture implementation and a use case, use mapreduce algorithm a input text file of the word count.
hadoop-0.20.2.tar
- Hadoop 是一个实现了 MapReduce 计算模型的开源分布式并行编程框架,借助于 Hadoop, 程序员可以轻松地编写分布式并行程序,将其运行于计算机集群上,完成海量数据的计算。-hadoop scource code
hadoop-0.20.1.tar
- hadoop平台的源代码,这这上面可以架设hadoop-hadoop
SampleMapReduce.tar
- hadoop pagerank implementation
mahout-0.2-project.tar
- 对搜索引擎的聚类,分类算法的代码实现 基于分布式的hadoop编程-Clustering search engine, code-based classification algorithm hadoop distributed programming
mahout-distribution-0.4.tar
- 对搜索引擎的聚类,分类算法的代码实现 基于分布式的hadoop编程-Clustering search engine, code-based classification algorithm hadoop distributed programming
hadoop-0.20.2.tar
- hadoop2.0源码 hadoop是一种分布式技术 可以处理海量数据-hadoop2.0 hadoop source is a distributed technology to handle massive data
hbase-0.20.6.tar
- Hbase是Hadoop一个正式一个子项目,是面向列的分布式数据库,它的分布不是关系型数据库 而是疏松的持久并按多维索引的map型 -Hbase is a formal a Hadoop subproject, is column-oriented distributed database, its distribution is not a relational database, but the persistent loose the map according to type of mu
gfarm-2.5.1.tar
- Gfarm 是一个分布式的文件系统,主要用于大规模的集群计算。-It s implemented in userland, and can be mounted by FUSE. It utilizes locality of a file to access a data node, and supports Globus GSI for Wide Area Network. Users can control file replica location on Gfarm. Gfarm can
WordCount.tar
- hadoop 中最基础最重要的例子,wordcount,将文件中的字符进行map\reduce,得到每个字符出现的次数-hadoop in the most basic of the most important example, wordcount, characters in the file, the map \ reduce the number of each character appears
mahout-distribution-0.5.tar
- Mahout 是 Apache Software Foundation(ASF) 旗下的一个开源项目,提供一些可扩展的机器学习领域经典算法的实现,旨在帮助开发人员更加方便快捷地创建智能应用程序。Apache Mahout项目已经发展到了它的第三个年头,目前已经有了三个公共发行版本。Mahout包含许多实现,包括集群、分类、推荐过滤、频繁子项挖掘。此外,通过使用 Apache Hadoop 库,Mahout 可以有效地扩展到云中。 -Mahout is Apache Software Founda
hadoop-2.7.2-src.tar
- 分布式大数据源码hadoop source(Distributed large data source Hadoop source)
hadoop-3.1.0-src.tar
- hadoop source code 3.1
hbase-0.98.20-hadoop1-bin.tar
- hbase-0.98-20压缩包,对hadoop感兴趣的人,并且需要它的可以下载(Hbase-0.98-20 compression package, interested in Hadoop, and it needs to be downloaded.)