搜索资源列表
WebSpider.rar
- 用C#编写的多线程抓取网页的“爬虫”程序,With C# Prepared multi-threaded web crawler "reptiles" procedure
spider_demo.rar
- C#多线程网络爬虫,使用线程池来控制线程,效率不错。,C# multi-threaded network reptiles, use the thread pool to control the thread, good efficiency.
WebSpider_src.rar
- 一个非常好的 C# 网络爬虫程序源码清晰,A very good C# Web crawler program source code clearly
OpenWebSpiderCS_v0.1.3
- 一个web爬虫 CSharp开发的,很小很不错,是个开放源代码的项目-CSharp developed a web crawler, very small and very good open source projects is
spider
- 本系统为简易网络爬虫,输入初始url,系统自动在网上搜索网页信息,并记录下来做为搜索引擎的数据.-The system for the Simple Network reptiles, enter the initial url, system automatically searches the Web page information, and record data as a search engine.
SinaBlogFirstCollecting
- Sina博客爬虫,基于C#编写.实现功能是通过回帖发现新用户,然后按深度优先抓取各个用户的所有信息.需要SQL Server-Sina blog reptiles, based on the C# Prepared. The realization of function is to discover new users through the replies, and then by depth-first crawl all the information each user. The ne
ESP
- 使用dotnet + 多线成的爬虫程序。 主要用于sina , 163 等大型论坛。 后台搭配数据库, 已经实现了 下载后的搜索, 图片已经实现下载在分类目录。 -Using dotnet+ Multi-line program into the reptiles. Mainly used sina, 163 and other large forums. Background with a database, has become a reality after downloa
NukeLitev0.1.0.0r24Preview2
- 轻量级爬虫+全文检索解决方案项目——NukeLite. 项目目前采用.Net Framework 3.5 , ADO.NET Entity Framework , MS SQLServer 2005, Log4net 开发。目前正在开发爬虫。 目前版本为 v0.1.0.0 r5 版,实现了最简单的爬虫。-Lightweight reptiles+ full-text search solution for the project- NukeLite. Project is curr
CSharpSpider
- C#写的网络爬虫程序。。十分详细。多线程式搜索、-C# Writing network reptiles procedures. . Very detailed. Multi-line program search,
CSharpSpider
- csharp 网络爬虫,升级版,适合初学者-CSharp Network reptiles, upgrade version, suitable for beginners
CScrawler
- 网页爬虫,用C#实现,对网页内容下载并检索内容-Crawler,C# development Envionment
b
- C#实现的支持代理服务器的网络_网页爬虫应用程序源代码-C# to achieve the support of the proxy server network applications _ reptiles page source code
WebPageCraweler4
- 用C#实现的网络爬虫,并支持多线程下载网页,并对网页进行压缩,便于存储-Using C# to achieve the network reptiles, and supports multi-threaded download page, and pages are compressed for storage
Crawler_src_code
- 网页爬虫(也被称做蚂蚁或者蜘蛛)是一个自动抓取万维网中网页数据的程序.网页爬虫一般都是用于抓取大量的网页,为日后搜索引擎处理服务的.抓取的网页由一些专门的程序来建立索引(如:Lucene,DotLucene),加快搜索的速度.爬虫也可以作为链接检查器或者HTML代码校验器来提供一些服务.比较新的一种用法是用来检查E-mail地址,用来防止Trackback spam.-A web crawler (also known as a web spider or ant) is a program,
BTdownload
- 爬虫 爬取指定网站 获取BT种子 并下载-Reptiles to climb from the designated website and download BT seed
123
- C#开发的Mashup和爬虫技术商品网,本项目根据实际需求进行开发的DEMO,应用了相关爬虫技术配置通用性规则实现大部分网站页面结构分析,爬取相关信息资源。 -C# development and reptiles Mashup commodity network technologies, the project carried out in accordance with the actual needs of the development of DEMO, the application
multi-thread-simple-crawler-socket
- 简易多线程网络爬虫基于C#语言socket编程-Simple multi-threaded web crawler socket programming language based on C#
csharpspider
- 简单的网络爬虫源码,有这方面兴趣的可以-A simple web crawler source code, there is interest in this area can see
PACHONG
- 网络爬虫程序源码 这是一款用 C# 编写的网络爬虫 主要特性有: 可配置:线程数、线程等待时间,连接超时时间,可爬取文件类型和优先级、下载目录等。 状态栏显示统计信息:排入队列URL数,已下载文件数,已下载总字节数,CPU使用率和可用内存等。 有偏好的爬虫:可针对爬取的资源类型设置不同的优先级。 健壮性:十几项URL正规化策略以排除冗余下载、爬虫陷阱避免策略的使用等、多种策略以解析相对路径等。 较好的性能:基于正则表达式的页面解析、适度加锁、维持HTTP连接等
CSharp2.0WebSpider
- 一个用CSharp 2.0 实现的网络爬虫算法源码-A realization with C# source code web crawler algorithm