<br><br><div><span class="gmail_quote">On 6/19/07, <b class="gmail_sendername">Larry Garfield</b> &lt;<a href="mailto:larry@garfieldtech.com">larry@garfieldtech.com</a>&gt; wrote:</span><blockquote class="gmail_quote" style="border-left: 1px solid rgb(204, 204, 204); margin: 0pt 0pt 0pt 0.8ex; padding-left: 1ex;">
<br>Disclaimer: I am not an RSS guru, just a pedant. :-)<br><br>RSS is XML.&nbsp;&nbsp;The XML spec explicitly says that invalid files should be discarded, not guessed at the way HTML is.&nbsp;&nbsp;Trying to make sense of a broken RSS feed is explicitly contrary to the spec.&nbsp;&nbsp;So, er, why are we spending so much time trying to sanitize?&nbsp;&nbsp;If it doesn&#39;t parse correctly, report an error &quot;this site&#39;s RSS feed is f*ed up, tell &#39;em to fix it&quot;.&nbsp;&nbsp;Am I missing something here?
</blockquote><div><br>And this is the point where I dive back in....<br><br>Many many many people have argued this.<br><br>Fact: many non proper XML RSS feeds exist in the wild.<br>Fact: if Drupal doesn&#39;t parse it, when other applications do, Drupal looks &quot;broken&quot;
<br>Fact: regular people like stuff that &quot;just works&quot;&nbsp; with any RSS feed out there, and will pick that over XML pedantry every day. <br></div><br></div>A checkbox for &quot;discard invalid XML&quot; makes perfect sense....for *some feeds* and *some use cases*.
<br><br clear="all"><br>-- <br>Boris Mann<br>Office 604-682-2889<br>Skype borismann<br><a href="http://www.bryght.com">http://www.bryght.com</a>