+1 to Laura&#39;s comment. <br><br>I&#39;ve written a crawler in php (non drupal project) and there are lots of considerations to think of, many of which don&#39;t crop up until your adding &quot;features&quot; to your crawler to make your results meaningful and more &quot;consumable&quot;.<br>
<br><div class="gmail_quote">On Tue, Oct 13, 2009 at 6:27 PM, Laura <span dir="ltr">&lt;<a href="mailto:pinglaura@gmail.com">pinglaura@gmail.com</a>&gt;</span> wrote:<br><blockquote class="gmail_quote" style="border-left: 1px solid rgb(204, 204, 204); margin: 0pt 0pt 0pt 0.8ex; padding-left: 1ex;">
You&#39;re limited by the quality of the search. Much better to create a<br>
Google search or use some other service where finding is their<br>
business. Then use aggregator or FeedAPI or some such solution to pull<br>
in the feed.<br>
<font color="#888888"><br>
Laura<br>
</font><div><div></div><div class="h5"><br>
On Oct 13, 2009, at Tue 10/13/09 7:09pm, brendan, <a href="http://fresh-off.com" target="_blank">fresh-off.com</a> wrote:<br>
<br>
&gt; Hello,<br>
&gt; I have a client that wants to know if there are any Drupal modules<br>
&gt; that search the web for content related to him and his company, and<br>
&gt; can then return the results (full articles or links to the content)<br>
&gt; to his drupal website.  For example, search the web for instances<br>
&gt; where &quot;john doe&quot; + &quot;XYZ Company&quot; both appear in the same piece of<br>
&gt; content.<br>
&gt;<br>
&gt; Creating the crawler is way beyond my technical ability, so I&#39;m<br>
&gt; hoping there are some good open source (preferably a Drupal module)<br>
&gt; options for this functionality.  Wikipedia has a list of open source<br>
&gt; web crawlers, but since this is a subject I&#39;m unfamiliar with, I&#39;m<br>
&gt; unsure about whether or not they can be integrated with Drupal - or<br>
&gt; if any open source web crawlers are even meant to be integrated with<br>
&gt; a CMS.<br>
&gt;<br>
&gt; A little bit more info about the use case: He and his company<br>
&gt; operate in the education field and are constantly being featured in<br>
&gt; articles (interviews, write-ups, etc) across the web.  In addition -<br>
&gt; and most importantly -  he and his company produce several papers/<br>
&gt; articles that are featured in articles and education related blogs<br>
&gt; across the internet as well.  He is finding that searching manually<br>
&gt; for this content to be impractical and thus, would love to have it<br>
&gt; automatically aggregated and sent to his Drupal site.<br>
&gt;<br>
&gt; Any thoughts, ideas, or pointers in the right direction would be<br>
&gt; apprecaiated!<br>
&gt;<br>
&gt;<br>
&gt; ----<br>
&gt;<br>
&gt; brendan, <a href="http://fresh-off.com" target="_blank">fresh-off.com</a><br>
&gt; Creative Direction &amp; Consultation: Web | Print | Brand<br>
&gt;<br>
&gt; <a href="http://fresh-off.com" target="_blank">http://fresh-off.com</a><br>
&gt; <a href="mailto:hello@fresh-off.com">hello@fresh-off.com</a><br>
&gt; 206.328.1067<br>
&gt;<br>
&gt;<br>
</div></div><div><div></div><div class="h5">&gt; _______________________________________________<br>
&gt; consulting mailing list<br>
&gt; <a href="mailto:consulting@drupal.org">consulting@drupal.org</a><br>
&gt; <a href="http://lists.drupal.org/mailman/listinfo/consulting" target="_blank">http://lists.drupal.org/mailman/listinfo/consulting</a><br>
<br>
_______________________________________________<br>
consulting mailing list<br>
<a href="mailto:consulting@drupal.org">consulting@drupal.org</a><br>
<a href="http://lists.drupal.org/mailman/listinfo/consulting" target="_blank">http://lists.drupal.org/mailman/listinfo/consulting</a><br>
</div></div></blockquote></div><br><br clear="all"><br>-- <br>Email is not a secure form of communication!<br><br>Drupal Consultant<br><a href="http://www.hazelconsulting.com/">http://www.hazelconsulting.com/</a><br>253.686.0296<br>
<a href="mailto:dave@hazelconsulting.com">dave@hazelconsulting.com</a><br>skype: hazelconsulting<br>gtalk:kananii<br><a href="http://www.facebook.com/davidhazel">http://www.facebook.com/davidhazel</a><br>ICQ: 366587185<br>