<!DOCTYPE html PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN">
<html>
<head>
  <meta content="text/html;charset=ISO-8859-1" http-equiv="Content-Type">
</head>
<body bgcolor="#ffffff" text="#000000">
Thank you for confirming Khalid. I actually never considered it may be
a core issue.<br>
<br>
With respect to 'something in includes/unicode.php' affecting it, the
only real settings that are changed are:<br>
<br>
// Set appropriate configuration<br>
&nbsp; mb_internal_encoding('utf-8');<br>
&nbsp; mb_language('uni');<br>
<br>
As far as I can tell, none of the remainder of the code would affect
the operation of iconv() or mb_convert_encoding(), which also exhibits
the same behaviour as iconv() is showing once drupal is bootstrapped.<br>
<br>
I would really appreciate any help anyone can offer in narrowing this
issue down, as this is a critical feature for our client.<br>
<br>
Brian<br>
<br>
<br>
<br>
Khalid Baheyeldin wrote:
<blockquote
 cite="mid:4a9fdc630911160751k352e6c6av533b7c6eb442f42b@mail.gmail.com"
 type="cite"><br>
  <br>
  <div class="gmail_quote">On Mon, Nov 16, 2009 at 10:42 AM, Brian Vuyk
  <span dir="ltr">&lt;<a moz-do-not-send="true"
 href="mailto:brian@brianvuyk.com">brian@brianvuyk.com</a>&gt;</span>
wrote:<br>
  <blockquote class="gmail_quote"
 style="border-left: 1px solid rgb(204, 204, 204); margin: 0pt 0pt 0pt 0.8ex; padding-left: 1ex;">Hi
all.<br>
    <br>
I am having a bit of a unique problem here, and I am hoping someone can
help me out.<br>
    <br>
In short, we are outputting strings from a custom module we wrote to an
external service that only accepts the ASCII character set. So, I am
trying to run all the strings through iconv() to convert them.<br>
    <br>
Here's the weird part. Take the script below:<br>
    <br>
$string = "St&eacute;phanie,D H&eacute;rouville";<br>
$output = iconv("UTF-8", 'ASCII//TRANSLIT', $string);<br>
print $output;<br>
    <br>
If I run this from the command line, I get the proper output -
'Stephanie D Herouville'. However, if I run it in my Drupal
installation, whether as part of a module or from the Devel 'Execute
PHP' box, I get different output: 'St?phanie D H?rouville'. That is,
instead of replacing the character with it's expected ASCII
counterpart, it replaces it with a ?.<br>
    <br>
Has anyone encountered this, or have any idea why this is happening?<br>
    <font color="#888888"><br>
Brian<br>
    </font></blockquote>
  </div>
  <br>
  <br>
I confirm what you are seeing:<br>
  <br>
If you have a file called ascii.php with this in it:<br>
  <br>
&lt;?php<br>
$string = "St&eacute;phanie,D H&eacute;rouville";<br>
$output = iconv("UTF-8", 'ASCII//TRANSLIT', $string);<br>
print $output . "\n";<br>
?&gt;<br>
  <br>
And run it as:<br>
  <br>
$ php ascii.php<br>
  <br>
The output is without the accented characters.<br>
  <br>
However, if you boot Drupal first, like so:<br>
  <br>
&lt;?php<br>
require_once './includes/bootstrap.inc';<br>
drupal_bootstrap(DRUPAL_BOOTSTRAP_FULL);<br>
  <br>
$string = "St&eacute;phanie,D H&eacute;rouville";<br>
$output = iconv("UTF-8", 'ASCII//TRANSLIT', $string);<br>
print $output . "\n";<br>
?&gt;<br>
  <br>
The output is with question marks, as you said.<br>
  <br>
I suspect something in includes/unicode.inc is causing this.<br>
-- <br>
Khalid M. Baheyeldin<br>
  <a moz-do-not-send="true" href="http://2bits.com">2bits.com</a>, Inc.<br>
  <a moz-do-not-send="true" href="http://2bits.com">http://2bits.com</a><br>
Drupal optimization, development, customization and consulting.<br>
Simplicity is prerequisite for reliability. -- &nbsp;Edsger W.Dijkstra<br>
Simplicity is the ultimate sophistication. -- &nbsp; Leonardo da Vinci<br>
</blockquote>
<br>
</body>
</html>