有没有办法在JAVA过滤器中访问完整的角URL（使用＃！）？

2018-07-02 03:30:28

我们有很多使用angular JS实现的页面。我们创建了离线快照HTML并将其存储到网络抓取工具中。

现在，当一个web爬虫要求一个特定的页面时，根据用户代理值，我们将请求重定向到一个JAVA servlet，该servlet将合适的快照页面返回给爬虫。

当请求从一个爬虫（比如Endeca）进入servlet时，我只是得到了url直到＃..并且URL中的＃之后的所有内容都丢失了，因此servlet无法返回相应的快照。

我知道它不可能通过http请求发送完整的url（和＃），但我想知道是否有办法解决这个问题。

curl -A "endeca webcrawler" "http://test.com/test#!/test1/id"

在JAVA servlet过滤器中，我只获得了http://test.com/test

注意：谷歌和bing位转换＃！ to _escaped_fragment，因此我没有看到这些抓取工具的问题。

链接地址: http://www.djcxy.com/p/89613.html