레이블이 한글인 게시물을 표시합니다. 모든 게시물 표시
레이블이 한글인 게시물을 표시합니다. 모든 게시물 표시

2009년 5월 14일 목요일

멀티바이트로 인코딩된 utf-8의 디코딩

죽음..
$str = "JCD비비안체크롱남방";

if (preg_match('/&#([0-9]{1,});/', $str))
    $str = mb_decode_numericentity($str, array(0x0, 0x10000, 0, 0xfffff), 'UTF-8');

echo iconv('utf-8','cp949', $str );
echo "\n----\n";

모뇽~~~

2008년 12월 4일 목요일

[패턴] 한글이 포함된 string의 패턴 매칭

이게 아닌데 이게 아닌데 아무리 해봐도 의도한 대로 결과가 나와 주지 않는다.
한글을 사용하기 위해선 encoding 모듈을 사용해야 하는 것을..쯧쯔..하루 종일 뭔 삽질인지
날도 추운데..

use encoding 'euc-kr'; # 이 놈이 모든것을 해결해 줌
$content = "_OBJ_GRID.setTextOnly('ordNm', maxRow, '장은정(cchang700)');_OBJ_GRID.setTextOnly('ordNm', maxRow, '장은정(cchang700)');_OBJ_GRID.setTextOnly('ordNm', maxRow, '장은정(cchang700)');";


while ($content =~ /_OBJ_GRID.setTextOnly\('([\w]+)', ([\w]+), '([\w\(\)\-]+)'\);/g) {
    print "Word is $1, $2 , $3 ends at position ", pos $content, "\n";
}



결과

================
 _OBJ_GRID.setTextOnly('ordNm', maxRow, '장은정(cchang700)');_OBJ_GRID.setTextOnly('ordNm', maxRow, '장은정(cchang700)')
;_OBJ_GRID.setTextOnly('ordNm', maxRow, '장은정(cchang700)');
===================
Word is ordNm, maxRow , 장은정(cchang700) ends at position 57
Word is ordNm, maxRow , 장은정(cchang700) ends at position 114
Word is ordNm, maxRow , 장은정(cchang700) ends at position 171

알고나면 뭐든 쉬운 것을 쯧쯔....