As a footnote on querypath, look at this snippet from the querypath wiki: <a href="https://fedorahosted.org/querypath/">https://fedorahosted.org/querypath/</a><div><br></div><div><a href="https://fedorahosted.org/querypath/"></a><span class="Apple-style-span" style="font-family: verdana, arial, &#39;Bitstream Vera Sans&#39;, helvetica, sans-serif; font-size: 13px; "><pre style="margin-top: 0px; margin-right: 0px; margin-bottom: 0px; margin-left: 0px; ">

&lt;?php
require_once &#39;QueryPath/QueryPath.php&#39;;

qp(&#39;./test.html&#39;)-&gt;find(&#39;title&#39;)-&gt;text(&#39;Welcome&#39;)-&gt;writeHTML();
?&gt;</pre><pre style="margin-top: 0px; margin-right: 0px; margin-bottom: 0px; margin-left: 0px; "><br></pre><pre style="margin-top: 0px; margin-right: 0px; margin-bottom: 0px; margin-left: 0px; ">This is for writing, but there are functions for everything.</pre>

<pre style="margin-top: 0px; margin-right: 0px; margin-bottom: 0px; margin-left: 0px; "><br></pre><pre style="margin-top: 0px; margin-right: 0px; margin-bottom: 0px; margin-left: 0px; ">Victor</pre></span><br><div class="gmail_quote">

On Tue, Apr 20, 2010 at 7:01 AM, Victor Kane <span dir="ltr">&lt;<a href="mailto:victorkane@gmail.com">victorkane@gmail.com</a>&gt;</span> wrote:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex;">

You will save a great deal of time with the mis-named &quot;Node Export&quot; module: <a href="http://drupal.org/project/node_export" target="_blank">drupal.org/project/node_export</a> <div>
It also handles bulk export, import, and I have used it to import thousands of nodes stored in a CSV format.</div><div>But, as Khalid says, there are no pictures or node references; from the project page:<div><br></div><div>


<span style="font-family:&#39;Bitstream Vera Sans&#39;, Verdana, Helvetica;font-size:13px;color:rgb(0, 49, 80);line-height:17px">&quot;Since the bulk export feature has been added, a lot of people have assumed this module will allow you to export the structure of a whole site and keep things like menu links, authors, node references, book hierarchy, etc.. BUT NO IT DOESN&#39;T. The reason is that the ID values that are used to identify the connections between things like that get changed around during an import. There are hooks that allow manipulation of nodes during imports/exports that could allow a programmer to add support for these features by tracking additional data to be able to fix the nodes afterwards, but nobody has gone to the trouble of doing that yet.&quot;</span><br>


<br><div class="gmail_quote">It is indeed amazing that no-one has gone to that trouble, or has shared solutions. For complex data structures, there is the migration module and the table wizard, which were designed for huge sites, and which the makers chose to share.</div>


<div class="gmail_quote"><br></div><div class="gmail_quote">The node_import module might be of use also, or roll your own script based on many snippets in the Drupal handbook and around the web.</div><div class="gmail_quote">


<br></div><div class="gmail_quote">This discussion on <a href="http://drupal.org" target="_blank">drupal.org</a> sums the &quot;state of the art&quot; perfectly:</div><div class="gmail_quote"><br></div><div class="gmail_quote">

<a href="http://drupal.org/node/762022#comment-2806388" target="_blank">drupal.org/node/762022#comment-2806388</a> and refers you to the discussion where there are some examples: <a href="http://drupal.org/node/178506" target="_blank">drupal.org/node/178506</a> (creating a node programmatically). </div>


<div class="gmail_quote"><br></div><div class="gmail_quote">Also: <a href="http://acquia.com/blog/migrating-drupal-way-part-i-creating-node" target="_blank">acquia.com/blog/migrating-drupal-way-part-i-creating-node</a></div>

<div class="gmail_quote">
<br></div><div class="gmail_quote">The import_html module is an option, but it brings a lot of overhead into the site in my opinion.</div><div class="gmail_quote"><br></div><div class="gmail_quote">A script to import static HTML would work by iterating over the files in a directory and then using common PHP functions to read in the text, and then extracting the body and sticking it into the body of the Drupal node. You can use a regular expression for that, or, this module is very interesting: <a href="http://drupal.org/project/querypath" target="_blank">drupal.org/project/querypath</a></div>


<div class="gmail_quote">Based on a &quot;scraper&quot; kind of program, It allows an &quot;xpath&quot; like approach for common html files. Check it out.</div><div class="gmail_quote"><br></div><div class="gmail_quote">

Any of these approaches are better than copying and pasting. A developer needs to shun copying and pasting. Even if you spend more time automating the process than brute force, you will have reusable tools.</div>
<div class="gmail_quote"><br></div><font color="#888888"><div class="gmail_quote">Victor Kane</div><div class="gmail_quote"><a href="http://awebfactory.com.ar" target="_blank">http://awebfactory.com.ar</a></div><div class="gmail_quote">

<a href="http://projectflowandtracker.com" target="_blank">http://projectflowandtracker.com</a></div></font><div><div></div><div class="h5">
<div class="gmail_quote"><br></div><div class="gmail_quote">On Tue, Apr 20, 2010 at 2:17 AM, Holly Ferree <span dir="ltr">&lt;<a href="mailto:hferree@gmail.com" target="_blank">hferree@gmail.com</a>&gt;</span> wrote:<br>

<blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">
Hi Bob,<br>
<br>
Thanks for the input. I&#39;m not web to scripts... I just didn&#39;t know what else<br>
to call them... I just want to know if there is a better way to insert a lot<br>
of content without so much clicking and copying/pasting. :)<br>
<br>
I am so thrilled to know about all these modules that I can try!<br>
<br>
I was curious if Excel could be used (it&#39;s all tables anyways)... Would you<br>
export it was a .csv?<br>
<br>
Thanks,<br>
<font color="#888888">Holly<br>
</font><div><div></div><div><br>
<br>
On 4/20/10 12:12 AM, &quot;Bob Schmitt&quot; &lt;<a href="mailto:bobschmitt@xinsys.net" target="_blank">bobschmitt@xinsys.net</a>&gt; wrote:<br>
<br>
&gt; I&#39;ve had pretty good luck with the Import/Export module<br>
&gt; (<a href="http://drupal.org/project/import_export_tool" target="_blank">http://drupal.org/project/import_export_tool</a>) and the Node Export module<br>
&gt; (<a href="http://drupal.org/project/node_export" target="_blank">http://drupal.org/project/node_export</a>). I can&#39;t remember which one is the<br>
&gt; best, but I have used them to dump/import more than 30K nodes organized in in<br>
&gt; 7 cck node types. It worked pretty well except for importing multiple taxonomy<br>
&gt; terms per node.<br>
&gt;<br>
&gt; I&#39;ve also used these modules to migrate content from other sites into Drupal<br>
&gt; sites using Excel and FilemakerPro as intermediary platforms to massage the<br>
&gt; data into the correct formats prior to the migration.<br>
&gt;<br>
&gt; Strictly speaking, neither of these are database migration scripts, but the<br>
&gt; get the job done.<br>
&gt;<br>
&gt; bob<br>
&gt;<br>
&gt; On Apr 19, 2010, at 9:11 PM, Holly Ferree wrote:<br>
&gt;<br>
&gt; Hi All,<br>
&gt;<br>
&gt; What is the most efficient way of transferring a site&#39;s content of 10 pages<br>
&gt; or more into drupal? (basically past the realm that you would want to copy<br>
&gt; and paste all the content to where another option would be easier to add a<br>
&gt; good amount of content would be the way to go)<br>
&gt;<br>
&gt; I have done the copy/paste of hundreds of lines of content from Word and<br>
&gt; done the whole create content &gt; page, paste and format content, save page,<br>
&gt; repeat process till I thought I would die of boredom...<br>
&gt;<br>
&gt; Please tell me there is a better way! (these sites have been from scratch or<br>
&gt; have not used a database previously. )<br>
&gt;<br>
&gt; Thanks,<br>
&gt;<br>
&gt; Holly Ferree, Graphic Designer, BFA<br>
&gt; <a href="mailto:hferree@gmail.com" target="_blank">hferree@gmail.com</a><br>
&gt; <a href="http://www.designbyholly.com/" target="_blank">http://www.designbyholly.com/</a><br>
&gt;<br>
&gt;<br>
&gt; PS I would also prefer to do it myself and not hire someone who doesn&#39;t mind<br>
&gt; repetitive work... :)<br>
&gt;<br>
&gt;<br>
&gt; _______________________________________________<br>
&gt; consulting mailing list<br>
&gt; <a href="mailto:consulting@drupal.org" target="_blank">consulting@drupal.org</a><br>
&gt; <a href="http://lists.drupal.org/mailman/listinfo/consulting" target="_blank">http://lists.drupal.org/mailman/listinfo/consulting</a><br>
&gt;<br>
&gt; Bob Schmitt<br>
&gt; 432 Harrison Ave.<br>
&gt; Helena, MT 59601<br>
&gt; Voice: +1.406.459.6537<br>
&gt; Skype: captbobalou<br>
&gt;<br>
&gt;<br>
&gt;<br>
&gt; _______________________________________________<br>
&gt; consulting mailing list<br>
&gt; <a href="mailto:consulting@drupal.org" target="_blank">consulting@drupal.org</a><br>
&gt; <a href="http://lists.drupal.org/mailman/listinfo/consulting" target="_blank">http://lists.drupal.org/mailman/listinfo/consulting</a><br>
<br>
Holly Ferree, Graphic Designer, BFA<br>
<a href="mailto:hferree@gmail.com" target="_blank">hferree@gmail.com</a><br>
<a href="http://www.designbyholly.com/" target="_blank">http://www.designbyholly.com/</a><br>
<br>
<br>
</div></div><div><div></div><div>_______________________________________________<br>
consulting mailing list<br>
<a href="mailto:consulting@drupal.org" target="_blank">consulting@drupal.org</a><br>
<a href="http://lists.drupal.org/mailman/listinfo/consulting" target="_blank">http://lists.drupal.org/mailman/listinfo/consulting</a><br>
</div></div></blockquote></div><br></div></div></div></div>
</blockquote></div><br></div>