正则提取网页中的图片示例源码

基本信息

源码名称：正则提取网页中的图片示例源码

源码大小：0.87KB

文件格式：.txt

开发语言：C#

更新时间：2014-04-01

友情提示：（无需注册或充值，赞助后即可获取资源下载链接）

嘿，亲！知识可是无价之宝呢，但咱这精心整理的资料也耗费了不少心血呀。小小地破费一下，绝对物超所值哦！如有下载和支付问题，请联系我们QQ(微信同号)：78630559

本次赞助数额为： 2 元　

源码介绍

        /// <summary>
        ///   取得HTML中所有图片的 URL。
        /// </summary>
        /// <param name="sHtmlText"> HTML代码 </param>
        /// <returns> 图片的URL列表 </returns>
        public string[] GetImgUrl(string sHtmlText)
        {
            // 定义正则表达式用来匹配 img 标签 
            var regImg =
                new Regex(
                    @"<img\b[^<>]*?\bsrc[\s\t\r\n]*=[\s\t\r\n]*[""']?[\s\t\r\n]*(?<imgUrl>[^\s\t\r\n""'<>]*)[^<>]*?/?[\s\t\r\n]*>",
                    RegexOptions.IgnoreCase);

            // 搜索匹配的字符串 
            var matches = regImg.Matches(sHtmlText);
            var i = 0;
            var sUrlList = new string[matches.Count];

            // 取得匹配项列表 
            foreach (Match match in matches)
                sUrlList[i  ] = match.Groups["imgUrl"].Value;
            return sUrlList;
        }