Thanks Cindy-Sue, Nestor, Nancy for your input.<br><br>There are two aspects here.<br><br><span style="color:rgb(0,0,153)"><b>1. Modifying/Tuning apache solr <br>2. Getting Drupal to work precisely what we need<br></b></span><br>
I know, the first one I have reference books, and confident going forward I will be able to manage it or if not I will put my queries in apache user mailing list as pointed by Cindy-Sue.<br><br>But for 2nd option &quot;Getting Drupal to work precisely what we need&quot; , probably we need to work out or put the queries to Drupal experts.<br>
<br>On a overall note, I am able to index the attached document (.txt, .doc, .docx, .pdf all types that I need).<br>But I am not liking the way I am doing it, as I create a node and attach the document programatically.<br>
Other option is created a node, per node attach huge number of document (say 50,000 documents), but not sure what all side impacts and performance issues will follow.  I am doing my best to find a way to do the indexing of files without creating a node. Looks media module apachesolr_file module may help, but could not get it working.<br>
<br>And, if you go to next level say, in hook _apachesolr_process_results just print the results , you will there are huge informations associated with result and the most important information (file belongs to which user) is not available.<br>
<br>I believe we can achieve these things using hooks. My findings till today are<br>1. While sending the document to solr for indexing by using removeParm function in an appropriate hook, remove the informations we do not need. <br>
2. While querying to get the files containing few words, that time probably in query alter hook, tweak the query in such a way that, the result will contain the precise informations we need.<br><br>Still a long way to go for me to get the things in order.<br>
<br>Best Regards<br>Austin<br><br>On Thu, Oct 18, 2012 at 3:35 AM, Ms. Nancy Wichmann <span dir="ltr">&lt;<a href="mailto:nan_wich@bellsouth.net" target="_blank">nan_wich@bellsouth.net</a>&gt;</span> wrote:<br><div class="gmail_quote">
<blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><div><div style="font-size:12pt;font-family:arial,helvetica,sans-serif"><div><span>We just installed Solr on two different sites. On one it is indexing the attachments, on the other it misses most. We have not totally tracked it down, but it seems to have something to do with the method of attachment.<br>
</span></div><div> </div><div><font color="#ff007f" face="bookman old style, new york, times, serif" size="4"><i><b>Nancy</b></i></font> <br></div><div><font face="arial, helvetica, sans-serif">Injustice anywhere is a threat to justice everywhere. -- Dr. Martin L. King, Jr.</font></div>
<div style="font-style:normal;font-size:16px;background-color:transparent;font-family:arial,helvetica,sans-serif"><br><blockquote style="border-left:2px solid rgb(16,16,255);margin-left:5px;margin-top:5px;padding-left:5px">
  <div style="font-family:arial,helvetica,sans-serif;font-size:12pt"> <div style="font-family:times new roman,new york,times,serif;font-size:12pt"> <div> <font face="Arial"> <hr size="1">  </font><div class="im"><br><div>
Austin Einter wrote:<br>
<blockquote style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">Looks whole list is silent in this regard (apache solr file attachment).<br>If you can share whatever idea you have on below queries, it will help me to great extent.<br>
 </blockquote></div></div></div></div> </div> </blockquote></div>   </div></div><br>--<br>
[ Drupal support list | <a href="http://lists.drupal.org/" target="_blank">http://lists.drupal.org/</a> ]<br></blockquote></div><br>