1. ホーム
  2. javascript

[解決済み] Window' 上で 'btoa' の実行に失敗しました。エンコードする文字列がLatin1範囲外の文字を含んでいます。

2022-04-24 20:49:16

質問

タイトルのエラーは、私のテストによると、Google Chromeでのみスローされます。大きなXMLファイルをbase64エンコードして、ダウンロードできるようにしています。

this.loader.src = "data:application/x-forcedownload;base64,"+
                  btoa("<?xml version=\"1.0\" encoding=\"utf-8\"?>"
                  +"<"+this.gamesave.tagName+">"
                  +this.xml.firstChild.innerHTML
                  +"</"+this.gamesave.tagName+">");

this.loader は非表示のiframeです。

通常、Google Chromeは以下のようなエラーでクラッシュします。 btoa を呼び出します。Mozilla Firefoxでは問題がないので、この問題はブラウザに関連したものです。 ファイル中に変な文字があることは認識していません。実際、私は非アスキー文字がないと信じています。

Q: 問題のある文字を見つけ、Chromeから文句を言われないように置き換えるにはどうしたらいいですか?

<サブ Downloadifyを使ってダウンロードを開始しようとしたのですが、うまくいきません。信頼性が低く、デバッグを可能にするようなエラーも発生しません。

解決方法を教えてください。

UTF8であれば、このように(実際にはSVGのソースで動作します)。

btoa(unescape(encodeURIComponent(str)))

の例です。

 var imgsrc = 'data:image/svg+xml;base64,' + btoa(unescape(encodeURIComponent(markup)));
 var img = new Image(1, 1); // width, height values are optional params 
 img.src = imgsrc;

そのbase64をデコードする必要がある場合は、これを使用します。

var str2 = decodeURIComponent(escape(window.atob(b64)));
console.log(str2);

var str = "äöüÄÖÜçéèñ";
var b64 = window.btoa(unescape(encodeURIComponent(str)))
console.log(b64);

var str2 = decodeURIComponent(escape(window.atob(b64)));
console.log(str2);

mobile-safariで動作させる場合は、base64データからホワイトスペースをすべて取り除く必要があるかもしれません...

function b64_to_utf8( str ) {
    str = str.replace(/\s/g, '');    
    return decodeURIComponent(escape(window.atob( str )));
}


2017年最新情報

この問題にまた悩まされることになりました。

単純な話、atobはUTF8文字列を扱えないんです。ASCIIのみです。

あと、js-base64のようなブロートウェアは使わない方がいいですね。

しかし webtoolkit は、小さくて素敵でとてもメンテナンスしやすい実装を持っています。

/**
*
*  Base64 encode / decode
*  http://www.webtoolkit.info
*
**/
var Base64 = {

    // private property
    _keyStr: "ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxyz0123456789+/="

    // public method for encoding
    , encode: function (input)
    {
        var output = "";
        var chr1, chr2, chr3, enc1, enc2, enc3, enc4;
        var i = 0;

        input = Base64._utf8_encode(input);

        while (i < input.length)
        {
            chr1 = input.charCodeAt(i++);
            chr2 = input.charCodeAt(i++);
            chr3 = input.charCodeAt(i++);

            enc1 = chr1 >> 2;
            enc2 = ((chr1 & 3) << 4) | (chr2 >> 4);
            enc3 = ((chr2 & 15) << 2) | (chr3 >> 6);
            enc4 = chr3 & 63;

            if (isNaN(chr2))
            {
                enc3 = enc4 = 64;
            }
            else if (isNaN(chr3))
            {
                enc4 = 64;
            }

            output = output +
                this._keyStr.charAt(enc1) + this._keyStr.charAt(enc2) +
                this._keyStr.charAt(enc3) + this._keyStr.charAt(enc4);
        } // Whend 

        return output;
    } // End Function encode 


    // public method for decoding
    ,decode: function (input)
    {
        var output = "";
        var chr1, chr2, chr3;
        var enc1, enc2, enc3, enc4;
        var i = 0;

        input = input.replace(/[^A-Za-z0-9\+\/\=]/g, "");
        while (i < input.length)
        {
            enc1 = this._keyStr.indexOf(input.charAt(i++));
            enc2 = this._keyStr.indexOf(input.charAt(i++));
            enc3 = this._keyStr.indexOf(input.charAt(i++));
            enc4 = this._keyStr.indexOf(input.charAt(i++));

            chr1 = (enc1 << 2) | (enc2 >> 4);
            chr2 = ((enc2 & 15) << 4) | (enc3 >> 2);
            chr3 = ((enc3 & 3) << 6) | enc4;

            output = output + String.fromCharCode(chr1);

            if (enc3 != 64)
            {
                output = output + String.fromCharCode(chr2);
            }

            if (enc4 != 64)
            {
                output = output + String.fromCharCode(chr3);
            }

        } // Whend 

        output = Base64._utf8_decode(output);

        return output;
    } // End Function decode 


    // private method for UTF-8 encoding
    ,_utf8_encode: function (string)
    {
        var utftext = "";
        string = string.replace(/\r\n/g, "\n");

        for (var n = 0; n < string.length; n++)
        {
            var c = string.charCodeAt(n);

            if (c < 128)
            {
                utftext += String.fromCharCode(c);
            }
            else if ((c > 127) && (c < 2048))
            {
                utftext += String.fromCharCode((c >> 6) | 192);
                utftext += String.fromCharCode((c & 63) | 128);
            }
            else
            {
                utftext += String.fromCharCode((c >> 12) | 224);
                utftext += String.fromCharCode(((c >> 6) & 63) | 128);
                utftext += String.fromCharCode((c & 63) | 128);
            }

        } // Next n 

        return utftext;
    } // End Function _utf8_encode 

    // private method for UTF-8 decoding
    ,_utf8_decode: function (utftext)
    {
        var string = "";
        var i = 0;
        var c, c1, c2, c3;
        c = c1 = c2 = 0;

        while (i < utftext.length)
        {
            c = utftext.charCodeAt(i);

            if (c < 128)
            {
                string += String.fromCharCode(c);
                i++;
            }
            else if ((c > 191) && (c < 224))
            {
                c2 = utftext.charCodeAt(i + 1);
                string += String.fromCharCode(((c & 31) << 6) | (c2 & 63));
                i += 2;
            }
            else
            {
                c2 = utftext.charCodeAt(i + 1);
                c3 = utftext.charCodeAt(i + 2);
                string += String.fromCharCode(((c & 15) << 12) | ((c2 & 63) << 6) | (c3 & 63));
                i += 3;
            }

        } // Whend 

        return string;
    } // End Function _utf8_decode 

}

https://www.fileformat.info/info/unicode/utf8.htm

  • 127(16進数0x7F)以下の文字については、UTF-8の は1バイトで表現します。これは、完全な unicodeの値です。これはASCIIの値とも同じです。

  • 2047(16 進 0x07FF)以下の文字については、UTF-8 の表現は2バイトに分散されます。最初のバイトは 上位2ビットを設定し、3ビット目をクリアにする(すなわち、0xC2~0xDF)。一方 2バイト目は、最上位ビットが設定され、2ビット目がクリアされます(例)。 0x80から0xBF)。

  • 2048 以上 65535 未満のすべての文字について (0xFFFF) の場合、UTF-8表現は3バイトに分散されます。