基本信息
源码名称:C#获取HTML源码及生成DOM树
源码大小:1.75M
文件格式:.rar
开发语言:C#
更新时间:2023-11-13
   友情提示:(无需注册或充值,赞助后即可获取资源下载链接)

     嘿,亲!知识可是无价之宝呢,但咱这精心整理的资料也耗费了不少心血呀。小小地破费一下,绝对物超所值哦!如有下载和支付问题,请联系我们QQ(微信同号):813200300

本次赞助数额为: 2 元 
   源码介绍
C#获取HTML源码及生成DOM树
本程序中实现用C#语言获取站点HTML源码,进而生成相应的DOM树 ,为进一步的网页解析提供方便

.
├── HTMLParser
│   ├── HTMLParser
│   │   ├── Form1.Designer.cs
│   │   ├── Form1.cs
│   │   ├── Form1.resx
│   │   ├── HTMLParser.csproj
│   │   ├── Program.cs
│   │   ├── Properties
│   │   │   ├── AssemblyInfo.cs
│   │   │   ├── Resources.Designer.cs
│   │   │   ├── Resources.resx
│   │   │   ├── Settings.Designer.cs
│   │   │   └── Settings.settings
│   │   ├── bin
│   │   │   └── Debug
│   │   │       ├── HTMLParser.exe
│   │   │       ├── HTMLParser.pdb
│   │   │       ├── HTMLParser.vshost.exe
│   │   │       ├── Winista.HtmlParser.dll
│   │   │       └── Winista.HtmlParser.pdb
│   │   └── obj
│   │       ├── Debug
│   │       │   ├── HTMLParser.Form1.resources
│   │       │   ├── HTMLParser.Properties.Resources.resources
│   │       │   ├── HTMLParser.csproj.GenerateResource.Cache
│   │       │   ├── HTMLParser.exe
│   │       │   ├── HTMLParser.pdb
│   │       │   ├── Refactor
│   │       │   ├── ResolveAssemblyReference.cache
│   │       │   └── TempPE
│   │       └── HTMLParser.csproj.FileList.txt
│   ├── HTMLParser.sln
│   ├── HTMLParser.suo
│   └── Winista.Htmlparser
│       ├── HtmlParser2003
│       │   ├── AssemblyInfo.cs
│       │   ├── Data
│       │   │   ├── AbstractData.cs
│       │   │   ├── ColumnData.cs
│       │   │   ├── ColumnDataCollection.cs
│       │   │   ├── HeadData.cs
│       │   │   ├── ImageData.cs
│       │   │   ├── ImageDataCollection.cs
│       │   │   ├── LinkData.cs
│       │   │   ├── LinkDataCollection.cs
│       │   │   ├── MetaTagData.cs
│       │   │   ├── MetaTagDataCollection.cs
│       │   │   ├── PageData.cs
│       │   │   ├── RowData.cs
│       │   │   ├── RowDataCollection.cs
│       │   │   ├── TableData.cs
│       │   │   ├── TableDataCollection.cs
│       │   │   └── ~vssc
│       │   ├── Extractors
│       │   │   ├── AbstractExtractor.cs
│       │   │   ├── EmailAddressExtractor.cs
│       │   │   ├── ImageExtractor.cs
│       │   │   ├── ImageLinkExtractor.cs
│       │   │   ├── LinkExtractor.cs
│       │   │   ├── PageExtractor.cs
│       │   │   ├── StringExtractor.cs
│       │   │   ├── TableExtractor.cs
│       │   │   └── ~vssc
│       │   ├── Filters
│       │   │   ├── AndFilter.cs
│       │   │   ├── AttributeRegexFilter.cs
│       │   │   ├── HasAttributeFilter.cs
│       │   │   ├── HasChildFilter.cs
│       │   │   ├── HasParentFilter.cs
│       │   │   ├── HasSiblingFilter.cs
│       │   │   ├── IsEqualFilter.cs
│       │   │   ├── LinkRegexFilter.cs
│       │   │   ├── LinkStringFilter.cs
│       │   │   ├── MailLinkFilter.cs
│       │   │   ├── NodeClassFilter.cs
│       │   │   ├── NotFilter.cs
│       │   │   ├── OrFilter.cs
│       │   │   ├── RegexFilter.cs
│       │   │   ├── StringFilter.cs
│       │   │   ├── TagNameFilter.cs
│       │   │   ├── XorFilter.cs
│       │   │   └── ~vssc
│       │   ├── HtmlParser2003.csproj
│       │   ├── HtmlParser2003.csproj.user
│       │   ├── HtmlParser2003.sln
│       │   ├── HtmlParser2003.suo
│       │   ├── Http
│       │   │   ├── HttpError.cs
│       │   │   ├── HttpProtocol.cs
│       │   │   ├── HttpProtocolContent.cs
│       │   │   ├── HttpProtocolOutput.cs
│       │   │   ├── HttpProtocolStatus.cs
│       │   │   ├── HttpResponseMgr.cs
│       │   │   ├── HttpUtil.cs
│       │   │   ├── ResourceGoneException.cs
│       │   │   ├── RetryLaterException.cs
│       │   │   ├── RobotBlockedException.cs
│       │   │   ├── RobotRulesParser.cs
│       │   │   └── ~vssc
│       │   ├── INode.cs
│       │   ├── INodeFactory.cs
│       │   ├── INodeFilter.cs
│       │   ├── IRemark.cs
│       │   ├── ITag.cs
│       │   ├── IText.cs
│       │   ├── Lex
│       │   │   ├── Cursor.cs
│       │   │   ├── InputStreamSource.cs
│       │   │   ├── Lexer.cs
│       │   │   ├── Page.cs
│       │   │   ├── PageAttribute.cs
│       │   │   ├── PageIndex.cs
│       │   │   ├── ParserStream.cs
│       │   │   ├── Source.cs
│       │   │   ├── StringSource.cs
│       │   │   └── ~vssc
│       │   ├── Lib
│       │   │   └── ICSharpCode.SharpZipLib.dll
│       │   ├── Nodes
│       │   │   ├── AbstractNode.cs
│       │   │   ├── RemarkNode.cs
│       │   │   ├── TagNode.cs
│       │   │   ├── TextNode.cs
│       │   │   └── ~vssc
│       │   ├── Parser.cs
│       │   ├── PrototypicalNodeFactory.cs
│       │   ├── Scanners
│       │   │   ├── CompositeTagScanner.cs
│       │   │   ├── IScanner.cs
│       │   │   ├── JspScanner.cs
│       │   │   ├── ScriptDecoder.cs
│       │   │   ├── ScriptScanner.cs
│       │   │   ├── StyleScanner.cs
│       │   │   ├── TagScanner.cs
│       │   │   └── ~vssc
│       │   ├── Support
│       │   │   ├── HashSetSupport.cs
│       │   │   ├── ICollectionSupport.cs
│       │   │   ├── ISetSupport.cs
│       │   │   ├── SupportMisc.cs
│       │   │   ├── Tokenizer.cs
│       │   │   └── ~vssc
│       │   ├── TagAttribute.cs
│       │   ├── Tags
│       │   │   ├── ATag.cs
│       │   │   ├── AppletTag.cs
│       │   │   ├── BaseHrefTag.cs
│       │   │   ├── BodyTag.cs
│       │   │   ├── Bullet.cs
│       │   │   ├── BulletList.cs
│       │   │   ├── CodeTag.cs
│       │   │   ├── CompositeTag.cs
│       │   │   ├── DefinitionList.cs
│       │   │   ├── DefinitionListBullet.cs
│       │   │   ├── Div.cs
│       │   │   ├── DoctypeTag.cs
│       │   │   ├── FormTag.cs
│       │   │   ├── FrameSetTag.cs
│       │   │   ├── FrameTag.cs
│       │   │   ├── HeadTag.cs
│       │   │   ├── HeadingTag.cs
│       │   │   ├── Html.cs
│       │   │   ├── IFrameTag.cs
│       │   │   ├── ImageTag.cs
│       │   │   ├── InputTag.cs
│       │   │   ├── JspTag.cs
│       │   │   ├── LabelTag.cs
│       │   │   ├── LinkTag.cs
│       │   │   ├── MetaTag.cs
│       │   │   ├── ObjectTag.cs
│       │   │   ├── OptionTag.cs
│       │   │   ├── ParagraphTag.cs
│       │   │   ├── ScriptTag.cs
│       │   │   ├── SelectTag.cs
│       │   │   ├── Span.cs
│       │   │   ├── StyleTag.cs
│       │   │   ├── TableColumn.cs
│       │   │   ├── TableHeader.cs
│       │   │   ├── TableRow.cs
│       │   │   ├── TableTag.cs
│       │   │   ├── TextareaTag.cs
│       │   │   ├── TitleTag.cs
│       │   │   └── ~vssc
│       │   ├── UpgradeLog.XML
│       │   ├── UpgradeLog2.XML
│       │   ├── UpgradeLog3.XML
│       │   ├── Util
│       │   │   ├── ChainedException.cs
│       │   │   ├── CharacterReference.cs
│       │   │   ├── CharacterReferenceEx.cs
│       │   │   ├── ContentProperties.cs
│       │   │   ├── DefaultParserFeedback.cs
│       │   │   ├── EncodingChangeException.cs
│       │   │   ├── FeedbackManager.cs
│       │   │   ├── GZIPUtils.cs
│       │   │   ├── INodeIterator.cs
│       │   │   ├── IParserFeedBack.cs
│       │   │   ├── ISimpleNodeIterator.cs
│       │   │   ├── IteratorImpl.cs
│       │   │   ├── NodeList.cs
│       │   │   ├── ParserConf.cs
│       │   │   ├── ParserException.cs
│       │   │   ├── ParserUtils.cs
│       │   │   ├── Sort
│       │   │   │   ├── IOrdered.cs
│       │   │   │   ├── ISortable.cs
│       │   │   │   ├── SortImpl.cs
│       │   │   │   └── ~vssc
│       │   │   ├── SpecialHashtable.cs
│       │   │   ├── StringUtil.cs
│       │   │   ├── Translate.cs
│       │   │   └── ~vssc
│       │   ├── Visitors
│       │   │   ├── HtmlPage.cs
│       │   │   ├── LinkFindingVisitor.cs
│       │   │   ├── NodeVisitor.cs
│       │   │   ├── TagFindingVisitor.cs
│       │   │   ├── TextExtractingVisitor.cs
│       │   │   ├── UrlModifyingVisitor.cs
│       │   │   └── ~vssc
│       │   ├── _ReSharper.HtmlParser2003
│       │   │   ├── 9b78c89b-1de6-47a6-8f62-4cd7d63089fa.Metadata
│       │   │   └── ReflectionCache.xml
│       │   ├── htmlparser-conf.xsl
│       │   ├── htmlparser-default.xml
│       │   ├── htmlparser-site.xml
│       │   ├── obj
│       │   │   ├── Debug
│       │   │   │   ├── HtmlParser2003.csproj.FileListAbsolute.txt
│       │   │   │   ├── ResolveAssemblyReference.cache
│       │   │   │   ├── TempPE
│       │   │   │   ├── Winista.HtmlParser.dll
│       │   │   │   └── Winista.HtmlParser.pdb
│       │   │   └── HtmlParser2003.csproj.FileList.txt
│       │   └── ~vssc
│       ├── Htmlparser.chm
│       └── bin
└── 好C#获取HTML源码及生成DOM树_HTMLParser.rar

42 directories, 196 files