<html><head><style type="text/css"><!-- DIV {margin:0px;} --></style></head><body><div style="font-family:arial, helvetica, sans-serif;font-size:14pt"><DIV></DIV>
<DIV>Does it do titles too? My problems is that even the&nbsp;entities for things like left double quotes create headaches for&nbsp;titles, in some cases causing Drupal to&nbsp;store the title as a blank. This, in turn, causes Pathauto to screw up. CKEditor does not fix this because it only deals with the body.<BR>&nbsp;</DIV>
<P><FONT face="bookman old style, new york, times, serif" color=#ff007f size=4><EM><STRONG>Nancy E. Wichmann, PMP</STRONG></EM></FONT></P>
<P><FONT face="arial, helvetica, sans-serif">Injustice anywhere is a threat to justice everywhere. -- Dr. Martin L. King, Jr.</FONT></P>
<DIV><BR></DIV>
<DIV style="FONT-SIZE: 14pt; FONT-FAMILY: arial, helvetica, sans-serif"><BR>
<DIV style="FONT-SIZE: 12pt; FONT-FAMILY: times new roman, new york, times, serif"><FONT face=Tahoma size=2>
<HR SIZE=1>
<B><SPAN style="FONT-WEIGHT: bold">From:</SPAN></B> Travis Carden &lt;travis.carden@gmail.com&gt;<BR><B><SPAN style="FONT-WEIGHT: bold">To:</SPAN></B> A list for Drupal consultants and Drupal service/hosting providers &lt;consulting@drupal.org&gt;<BR><B><SPAN style="FONT-WEIGHT: bold">Sent:</SPAN></B> Fri, April 23, 2010 4:11:28 PM<BR><B><SPAN style="FONT-WEIGHT: bold">Subject:</SPAN></B> Re: [consulting] HTML Character Sanitization Solution<BR></FONT><BR><FONT face=verdana,sans-serif>For correcting invalid (x)HTML—even Microsoft Word crap—I know of no better solution than <A href="http://drupal.org/project/htmlpurifier" target=_blank rel=nofollow>HTML Purifier</A>, which actually does an outstanding job, in my experience. It can be a little too restrictive for some use cases as it filters out JavaScript, OBJECT/EMBED, and IFRAME (and you can't configure it not to, as far as I can tell). In some such situations it can be helpfully paired with <A
 href="http://drupal.org/project/video_filter" target=_blank rel=nofollow>Video Filter</A> and <A href="http://drupal.org/project/iframe_filter" target=_blank rel=nofollow>Iframe Filter</A> or <A href="http://drupal.org/project/insertFrame" target=_blank rel=nofollow>insertFrame</A>. (I don't have a solution for using it with JavaScript.) I suspect this module would solve most people's issues—I <I>think</I> it will even strip non-ASCII characters. Benjamin Finklea gives a good explanation of the module's installation and use in his book <A href="http://amazon.com/o/ASIN/1847198228/ref=nosim/traviscardenc-20" target=_blank rel=nofollow>Drupal 6 Search Engine Optimization</A> from Packt.<BR><BR>Unfortunately, I can't use HTML Purifier with my current client because it's too restrictive for his needs. So what I'm looking for is something that does nothing other than strip or (preferably) convert non-ASCII characters to their equivalent HTML entities. e.g.
 convert “My problem,” he said, “is simple—WYSIWYGs.” would become &amp;ldquo;My problem,&amp;rdquo; he said, &amp;ldquo;is simple&amp;mdash;WYSIWYGs.&amp;rdquo;. I have a sense that a good WYSIWYG should do this, but I haven't had any success with FCKEditor's "paste from Word" feature. Has anyone else? Does TinyMCE do any better?<BR></FONT></DIV></DIV></div></body></html>