嘿,亲!知识可是无价之宝呢,但咱这精心整理的资料也耗费了不少心血呀。小小地破费一下,绝对物超所值哦!如有下载和支付问题,请联系我们QQ(微信同号):813200300
本次赞助数额为: 2 元微信扫码支付:2 元
请留下您的邮箱,我们将在2小时内将文件发到您的邮箱
C#获取HTML源码及生成DOM树
本程序中实现用C#语言获取站点HTML源码,进而生成相应的DOM树 ,为进一步的网页解析提供方便
.
├── HTMLParser
│ ├── HTMLParser
│ │ ├── Form1.Designer.cs
│ │ ├── Form1.cs
│ │ ├── Form1.resx
│ │ ├── HTMLParser.csproj
│ │ ├── Program.cs
│ │ ├── Properties
│ │ │ ├── AssemblyInfo.cs
│ │ │ ├── Resources.Designer.cs
│ │ │ ├── Resources.resx
│ │ │ ├── Settings.Designer.cs
│ │ │ └── Settings.settings
│ │ ├── bin
│ │ │ └── Debug
│ │ │ ├── HTMLParser.exe
│ │ │ ├── HTMLParser.pdb
│ │ │ ├── HTMLParser.vshost.exe
│ │ │ ├── Winista.HtmlParser.dll
│ │ │ └── Winista.HtmlParser.pdb
│ │ └── obj
│ │ ├── Debug
│ │ │ ├── HTMLParser.Form1.resources
│ │ │ ├── HTMLParser.Properties.Resources.resources
│ │ │ ├── HTMLParser.csproj.GenerateResource.Cache
│ │ │ ├── HTMLParser.exe
│ │ │ ├── HTMLParser.pdb
│ │ │ ├── Refactor
│ │ │ ├── ResolveAssemblyReference.cache
│ │ │ └── TempPE
│ │ └── HTMLParser.csproj.FileList.txt
│ ├── HTMLParser.sln
│ ├── HTMLParser.suo
│ └── Winista.Htmlparser
│ ├── HtmlParser2003
│ │ ├── AssemblyInfo.cs
│ │ ├── Data
│ │ │ ├── AbstractData.cs
│ │ │ ├── ColumnData.cs
│ │ │ ├── ColumnDataCollection.cs
│ │ │ ├── HeadData.cs
│ │ │ ├── ImageData.cs
│ │ │ ├── ImageDataCollection.cs
│ │ │ ├── LinkData.cs
│ │ │ ├── LinkDataCollection.cs
│ │ │ ├── MetaTagData.cs
│ │ │ ├── MetaTagDataCollection.cs
│ │ │ ├── PageData.cs
│ │ │ ├── RowData.cs
│ │ │ ├── RowDataCollection.cs
│ │ │ ├── TableData.cs
│ │ │ ├── TableDataCollection.cs
│ │ │ └── ~vssc
│ │ ├── Extractors
│ │ │ ├── AbstractExtractor.cs
│ │ │ ├── EmailAddressExtractor.cs
│ │ │ ├── ImageExtractor.cs
│ │ │ ├── ImageLinkExtractor.cs
│ │ │ ├── LinkExtractor.cs
│ │ │ ├── PageExtractor.cs
│ │ │ ├── StringExtractor.cs
│ │ │ ├── TableExtractor.cs
│ │ │ └── ~vssc
│ │ ├── Filters
│ │ │ ├── AndFilter.cs
│ │ │ ├── AttributeRegexFilter.cs
│ │ │ ├── HasAttributeFilter.cs
│ │ │ ├── HasChildFilter.cs
│ │ │ ├── HasParentFilter.cs
│ │ │ ├── HasSiblingFilter.cs
│ │ │ ├── IsEqualFilter.cs
│ │ │ ├── LinkRegexFilter.cs
│ │ │ ├── LinkStringFilter.cs
│ │ │ ├── MailLinkFilter.cs
│ │ │ ├── NodeClassFilter.cs
│ │ │ ├── NotFilter.cs
│ │ │ ├── OrFilter.cs
│ │ │ ├── RegexFilter.cs
│ │ │ ├── StringFilter.cs
│ │ │ ├── TagNameFilter.cs
│ │ │ ├── XorFilter.cs
│ │ │ └── ~vssc
│ │ ├── HtmlParser2003.csproj
│ │ ├── HtmlParser2003.csproj.user
│ │ ├── HtmlParser2003.sln
│ │ ├── HtmlParser2003.suo
│ │ ├── Http
│ │ │ ├── HttpError.cs
│ │ │ ├── HttpProtocol.cs
│ │ │ ├── HttpProtocolContent.cs
│ │ │ ├── HttpProtocolOutput.cs
│ │ │ ├── HttpProtocolStatus.cs
│ │ │ ├── HttpResponseMgr.cs
│ │ │ ├── HttpUtil.cs
│ │ │ ├── ResourceGoneException.cs
│ │ │ ├── RetryLaterException.cs
│ │ │ ├── RobotBlockedException.cs
│ │ │ ├── RobotRulesParser.cs
│ │ │ └── ~vssc
│ │ ├── INode.cs
│ │ ├── INodeFactory.cs
│ │ ├── INodeFilter.cs
│ │ ├── IRemark.cs
│ │ ├── ITag.cs
│ │ ├── IText.cs
│ │ ├── Lex
│ │ │ ├── Cursor.cs
│ │ │ ├── InputStreamSource.cs
│ │ │ ├── Lexer.cs
│ │ │ ├── Page.cs
│ │ │ ├── PageAttribute.cs
│ │ │ ├── PageIndex.cs
│ │ │ ├── ParserStream.cs
│ │ │ ├── Source.cs
│ │ │ ├── StringSource.cs
│ │ │ └── ~vssc
│ │ ├── Lib
│ │ │ └── ICSharpCode.SharpZipLib.dll
│ │ ├── Nodes
│ │ │ ├── AbstractNode.cs
│ │ │ ├── RemarkNode.cs
│ │ │ ├── TagNode.cs
│ │ │ ├── TextNode.cs
│ │ │ └── ~vssc
│ │ ├── Parser.cs
│ │ ├── PrototypicalNodeFactory.cs
│ │ ├── Scanners
│ │ │ ├── CompositeTagScanner.cs
│ │ │ ├── IScanner.cs
│ │ │ ├── JspScanner.cs
│ │ │ ├── ScriptDecoder.cs
│ │ │ ├── ScriptScanner.cs
│ │ │ ├── StyleScanner.cs
│ │ │ ├── TagScanner.cs
│ │ │ └── ~vssc
│ │ ├── Support
│ │ │ ├── HashSetSupport.cs
│ │ │ ├── ICollectionSupport.cs
│ │ │ ├── ISetSupport.cs
│ │ │ ├── SupportMisc.cs
│ │ │ ├── Tokenizer.cs
│ │ │ └── ~vssc
│ │ ├── TagAttribute.cs
│ │ ├── Tags
│ │ │ ├── ATag.cs
│ │ │ ├── AppletTag.cs
│ │ │ ├── BaseHrefTag.cs
│ │ │ ├── BodyTag.cs
│ │ │ ├── Bullet.cs
│ │ │ ├── BulletList.cs
│ │ │ ├── CodeTag.cs
│ │ │ ├── CompositeTag.cs
│ │ │ ├── DefinitionList.cs
│ │ │ ├── DefinitionListBullet.cs
│ │ │ ├── Div.cs
│ │ │ ├── DoctypeTag.cs
│ │ │ ├── FormTag.cs
│ │ │ ├── FrameSetTag.cs
│ │ │ ├── FrameTag.cs
│ │ │ ├── HeadTag.cs
│ │ │ ├── HeadingTag.cs
│ │ │ ├── Html.cs
│ │ │ ├── IFrameTag.cs
│ │ │ ├── ImageTag.cs
│ │ │ ├── InputTag.cs
│ │ │ ├── JspTag.cs
│ │ │ ├── LabelTag.cs
│ │ │ ├── LinkTag.cs
│ │ │ ├── MetaTag.cs
│ │ │ ├── ObjectTag.cs
│ │ │ ├── OptionTag.cs
│ │ │ ├── ParagraphTag.cs
│ │ │ ├── ScriptTag.cs
│ │ │ ├── SelectTag.cs
│ │ │ ├── Span.cs
│ │ │ ├── StyleTag.cs
│ │ │ ├── TableColumn.cs
│ │ │ ├── TableHeader.cs
│ │ │ ├── TableRow.cs
│ │ │ ├── TableTag.cs
│ │ │ ├── TextareaTag.cs
│ │ │ ├── TitleTag.cs
│ │ │ └── ~vssc
│ │ ├── UpgradeLog.XML
│ │ ├── UpgradeLog2.XML
│ │ ├── UpgradeLog3.XML
│ │ ├── Util
│ │ │ ├── ChainedException.cs
│ │ │ ├── CharacterReference.cs
│ │ │ ├── CharacterReferenceEx.cs
│ │ │ ├── ContentProperties.cs
│ │ │ ├── DefaultParserFeedback.cs
│ │ │ ├── EncodingChangeException.cs
│ │ │ ├── FeedbackManager.cs
│ │ │ ├── GZIPUtils.cs
│ │ │ ├── INodeIterator.cs
│ │ │ ├── IParserFeedBack.cs
│ │ │ ├── ISimpleNodeIterator.cs
│ │ │ ├── IteratorImpl.cs
│ │ │ ├── NodeList.cs
│ │ │ ├── ParserConf.cs
│ │ │ ├── ParserException.cs
│ │ │ ├── ParserUtils.cs
│ │ │ ├── Sort
│ │ │ │ ├── IOrdered.cs
│ │ │ │ ├── ISortable.cs
│ │ │ │ ├── SortImpl.cs
│ │ │ │ └── ~vssc
│ │ │ ├── SpecialHashtable.cs
│ │ │ ├── StringUtil.cs
│ │ │ ├── Translate.cs
│ │ │ └── ~vssc
│ │ ├── Visitors
│ │ │ ├── HtmlPage.cs
│ │ │ ├── LinkFindingVisitor.cs
│ │ │ ├── NodeVisitor.cs
│ │ │ ├── TagFindingVisitor.cs
│ │ │ ├── TextExtractingVisitor.cs
│ │ │ ├── UrlModifyingVisitor.cs
│ │ │ └── ~vssc
│ │ ├── _ReSharper.HtmlParser2003
│ │ │ ├── 9b78c89b-1de6-47a6-8f62-4cd7d63089fa.Metadata
│ │ │ └── ReflectionCache.xml
│ │ ├── htmlparser-conf.xsl
│ │ ├── htmlparser-default.xml
│ │ ├── htmlparser-site.xml
│ │ ├── obj
│ │ │ ├── Debug
│ │ │ │ ├── HtmlParser2003.csproj.FileListAbsolute.txt
│ │ │ │ ├── ResolveAssemblyReference.cache
│ │ │ │ ├── TempPE
│ │ │ │ ├── Winista.HtmlParser.dll
│ │ │ │ └── Winista.HtmlParser.pdb
│ │ │ └── HtmlParser2003.csproj.FileList.txt
│ │ └── ~vssc
│ ├── Htmlparser.chm
│ └── bin
└── 好C#获取HTML源码及生成DOM树_HTMLParser.rar
42 directories, 196 files