有没有办法在JAVA过滤器中访问完整的角URL(使用#!)?
我们有很多使用angular JS实现的页面。 我们创建了离线快照HTML并将其存储到网络抓取工具中。
现在,当一个web爬虫要求一个特定的页面时,根据用户代理值,我们将请求重定向到一个JAVA servlet,该servlet将合适的快照页面返回给爬虫。
当请求从一个爬虫(比如Endeca)进入servlet时,我只是得到了url直到#..并且URL中的#之后的所有内容都丢失了,因此servlet无法返回相应的快照。
我知道它不可能通过http请求发送完整的url(和#),但我想知道是否有办法解决这个问题。
curl -A "endeca webcrawler" "http://test.com/test#!/test1/id"
在JAVA servlet过滤器中,我只获得了http://test.com/test
注意:谷歌和bing位转换#! to _escaped_fragment,因此我没有看到这些抓取工具的问题。
链接地址: http://www.djcxy.com/p/89613.html上一篇: Is there a way to access complete angular URL (with #!) in JAVA filter?