支付宝扫一扫付款
微信扫一扫付款
(微信为保护隐私,不显示你的昵称)
CssSelector组件把CSS选择器转换成Xpath表达式。
你可以通过下述两种方式安装:
通过Composer安装(Packagist上的symfony/css-selector
)
通过官方Git宝库(https://github.com/symfony/css-selector)
然后,包容vendor/autoload.php
文件,以开启Composer提供的自动加载机制。否则,你的程序将无法找到这个Symfony组件的类。
当你要解析一个HTML或XML文档时,目前最强力的方法是Xpath。
Xpath表达式极其灵活,几乎总是有会有一个Xpath表达式能够找到你需要的元素。不幸的是,它们也变得非常复杂,学习曲线是陡峭的。甚至普通操作(像是查找一个带有特定的class的元素)都需要很长很笨重的表达式。
许多开发者——特别是web开发者——习惯于使用CSS选择器(selector)来找到元素。不光适合于样式表,CSS选择器配合 querySelectorAll
函数还可用于JavaScript,包括流行的JS类库比如JQuery,Prototype以及MooTools等。
CSS选择器相比Xpath少了几分强大,但却易写、易读、易理解。由于它们不够强力,差不多所有的CSS选择器都可以被转换为一个等价的Xpath。然后这个Xpath表达式即可用于其他的函数或类中,以便借助Xpath来在文档中查找元素。
本组件的唯一目标就是把CSS selector转换成与之等价的Xpath,使用 toXPath()
方法:
1 2 3 4 | use Symfony\Component\CssSelector\CssSelectorConverter;
$converter = new CssSelectorConverter();
var_dump($converter->toXPath('div.item > h4 > a')); |
这会输出以下内容:
1 | descendant-or-self::div[@class and contains(concat(' ',normalize-space(@class), ' '), ' item ')]/h4/a |
你可以将这个表达式用在,比如, DOMXPath
或是 SimpleXMLElement
中,以便在文档中找到元素。
Crawler::filter()
方法使用CssSelector组件,基于一个CSS选择器字符串来查找元素。参考 DomCrawler组件 以了解细节。
不是所有CSS选择器都可以被转换为等价的Xpath。
有几个CSS selector只对浏览器上下文有意义。
:link
, :visited
, :target
:hover
, :focus
, :active
:invalid
, :indeterminate
(however, :enabled
,
:disabled
, :checked
and :unchecked
are available)Pseudo-elements (:before
, :after
, :first-line
,
:first-letter
) 伪元素不受支持,因为它们选择的是文本部分而非元素。
另有几个pseudo-classes(伪类)尚未支持:
*:first-of-type
, *:last-of-type
, *:nth-of-type
,
*:nth-last-of-type
, *:only-of-type
. (这些都与一个元素的名称 (如 li:first-of-type
) 一起工作,但却不能与 *
工作。)本文,包括例程代码在内,采用的是 Creative Commons BY-SA 3.0 创作共用授权。