如何用正则表达式匹配一个域名

我在做一个站内搜索引擎 现在在匹配上出现问题了

比如说 我做的引擎在淘宝上 我想把淘宝上所有的***.taobao.com以及***.taobao.com/***的链接全部得到,需要一个正则表达式把例如www.baidu.com的链接屏蔽掉 急求 以前没接触过正则表达式

\w+.taobao.com(/\S+)?