[過去ログ]
【PHP】下らねぇ質問はここに書き込みやがれ 14 (1002レス)
【PHP】下らねぇ質問はここに書き込みやがれ 14 http://mevius.5ch.net/test/read.cgi/tech/1663659983/
上
下
前
次
1-
新
通常表示
512バイト分割
レス栞
このスレッドは過去ログ倉庫に格納されています。
次スレ検索
歴削→次スレ
栞削→次スレ
過去ログメニュー
1: デフォルトの名無しさん (ワッチョイ 0f97-W3aP) [] 2022/09/20(火) 16:46:23.39 ID:Sb2Kpzh+0 !extend::vvvvv:1000:512 !extend::vvvvv:1000:512 ★スレ立て時 ↑ が3行以上になるようコピペ PHPに関する質問スレです 前スレ 【PHP】下らねぇ質問はここに書き込みやがれ 13 https://mevius.5ch.net/test/read.cgi/tech/1631147923/ 次スレは>>980以降 VIPQ2_EXTDAT: default:vvvvv:1000:512:: EXT was configured VIPQ2_EXTDAT: default:vvvvv:1000:512:: EXT was configured http://mevius.5ch.net/test/read.cgi/tech/1663659983/1
922: デフォルトの名無しさん (ワッチョイ eb7b-1jHB) [sage] 2024/10/16(水) 22:44:42.10 ID:XSPkOsBG0 >>921 php.netを頭から全部読めばそれで十分 多分SQLも必須、というかPHPは自身の変数等を保持する機構が言語にないのでどうせDBを使うことになる http://mevius.5ch.net/test/read.cgi/tech/1663659983/922
923: デフォルトの名無しさん (ワッチョイ ef5f-nmm0) [sage] 2024/10/17(木) 00:25:58.27 ID:exPg1AY+0 >>922 本物のワルなのでセッション使っちゃうぜ http://mevius.5ch.net/test/read.cgi/tech/1663659983/923
924: デフォルトの名無しさん (スップ Sdbf-qfF2) [sage] 2024/10/17(木) 00:33:42.25 ID:13fsix/Td >>922 先生!ぼくおじさんなので本にカキカキメモしながらじゃないと勉強できません 後出しですがSQLも基本的なところはできます 独習PHP 第4版が古すぎるとかいうのでなければよいのですが http://mevius.5ch.net/test/read.cgi/tech/1663659983/924
925: デフォルトの名無しさん (ワッチョイ eb7b-1jHB) [sage] 2024/10/17(木) 08:25:20.34 ID:aXgLojE+0 >>923 ユーザーまたげねえだろ というか普通のサーバーのように、全体の変数を保持する事が出来ない だから毎回初期値やデータを一からロードし直す必要があってウザかったが、 JSもクローム拡張V3では同様になってるから、サーバーとしては適切な構造なのだろうよ PHPの場合、これにより毎回最初から行うのを強制され、結果的に毎回同じ動作となり、デバッグしやすくなってるのも事実 糞言語だが、何だかんだで結果的によく出来てるから使い続
けられてる でもやはりウザイのも事実で、Node他ならもうちょっとすっきり書けるのに、というのは多々ある ちょっとした配列を保持出来てれば済むのに、一々DBにtry-catchになるから >>924 持ってないから知らん http://mevius.5ch.net/test/read.cgi/tech/1663659983/925
926: デフォルトの名無しさん (ワッチョイ efe7-nmm0) [sage] 2024/10/17(木) 08:51:18.77 ID:Q0zeibWJ0 >>925 セッションIDを知っていればユーザーを跨げるので、本物のワルはこれを悪用しちゃうぜ http://mevius.5ch.net/test/read.cgi/tech/1663659983/926
927: デフォルトの名無しさん (ワッチョイ eb7b-1jHB) [sage] 2024/10/17(木) 09:15:02.73 ID:aXgLojE+0 >>926 いやそれはアウトだろ ただ、「絶対に誰にも使われないセッションID」を作れれば便利な倉庫に出来るのかな? まあ俺はそこまでPHP知らんので止めとくが しかしPHPは色々糞ったれなことが多い 今目に付いてるのはアップロードされたファイルが $_FILES["pictures"]["tmp_name"][$index] に入る点 逆じゃボケ!!!$_FILES["pictures"][$index]["tmp_name"] に入れろや!!!ってね この辺一々
糞コード化を余儀なくされてストレスが溜まる まあlaravel導入すれば解決するんだろうけどさ http://mevius.5ch.net/test/read.cgi/tech/1663659983/927
928: デフォルトの名無しさん (ワッチョイ db85-xAPd) [sage] 2024/10/17(木) 23:09:44.41 ID:goFejqio0 >921 私見で恐縮だけど、それだけ他言語を学習済みなら(経験年数にもよるけど)基礎的な事は理解してるはずだから書籍はあんまり意味を為さないと思うなー ?他の人も言ってるようにリファレンス読み込むのがいいと思う。どのページに何が書いてあるか理解把握するのが大事かな、と。あくまで重要なのはリファレンスの内容を覚えるんじゃなくて、必要な時に直ぐに取り出せるように「何処に何が書いてあるか」を理解把握すると良いと思うよ。例えば
php7系とphp8系で大幅に仕様変更があったんだけどその差異を見るにはどのページ見れば良いかとか、もっとシンプルに言うと関数のリファレンスは何処に纏まってるか、とか。 ?の手順が終わったら、プログラム経験者でphp手っ取り早く学びたいならLaravelの環境を構築するかまたはWordPress作って弄り倒すのが良いと思う。 前者の理由は、ここ数年のphp開発現場はLaravelを基本としてるから。 後者の理由は、WordPressはphpで構成されているのでソースレベルで弄り倒せるようになれればclassや一通りの組み込み関数も理解出来ていると判断できるから(俺
社比) 若干話変わって個人的に興味があるのは、何故phpを学習したいと思ったのかを知りたいな 聞きたい理由としては、phpって言語としても旬は過ぎたし、もしWordPressが使われなくなったらレガシーな環境を除けばphpを選択する意味が無くなってきてると個人的に感じてるのよね。(俺自身はphp好きだけどw) 例えば最近ならNode.js+TypeScript+.vueとかの方が需要高いから何故phpを学ぼうと思ったかその機会を知りたいと思いました。長文スマンでした http://mevius.5ch.net/test/read.cgi/tech/1663659983/928
929: デフォルトの名無しさん (ワッチョイ db85-xAPd) [sage] 2024/10/17(木) 23:37:25.31 ID:goFejqio0 横レスおじさんだけどごめんね❤ >923 については、確かにセッション使えば自身の変数は保持できる >925 に対しては、おっしゃる通りユーザ跨げない。後述(※参照)するけど、ユーザー跨ごうとすると変則的な運用のみ使えると思う(という知見しか自分には無い)から結論非常にオススメしない。 >926 マジでオススメしない。理由はセッションIDを対象ユーザー以外で使うのは大事故に繋がるから。 (※)一応例外も挙げておくけど
、【そのサービスを1人しか利用しない】という前提ならもしかしたらありかな?とは思う。逆を言えばそれくらいのレベル感じゃ無いとセッションIDの使い回しは超御法度。 つまり非常に限定的で、ローカル環境で構築したサービスや外部非公開の環境というのが前提で、もし外部に公開するサービスならセッションIDは絶対に使い回しちゃダメよ、って事。 http://mevius.5ch.net/test/read.cgi/tech/1663659983/929
930: デフォルトの名無しさん (ワッチョイ eb7b-1jHB) [sage] 2024/10/18(金) 07:32:13.18 ID:IRpwug8I0 >>928 > レガシーな環境を除けばphpを選択する意味が無くなってきてる 商用ならその通り ただしレンタルサーバーのような小口だと、プロセス2秒でぶった切る運用が出来るPHPの方が相性がいい だからブログにはPHP+WPの方が相性がよく、 今のところ他言語では…そういえばHugoとかあったがあれどうなったんだろ? ちなみにphp.net、読み物としては非常に優秀だが、リファレンスとして逆引きするにはイマイチだと分かった だから一通り知って
、しばらく使わずに忘れて、再確認したいときに > 何処に何が書いてあるか を覚えておかないと辿り着けない (逆に他言語は逆引きするように書いているから、頭から読む読み物としてはイマイチ) http://mevius.5ch.net/test/read.cgi/tech/1663659983/930
931: デフォルトの名無しさん (ワッチョイ ef29-xAPd) [sage] 2024/10/18(金) 08:54:50.32 ID:WQ7AgxmX0 >930 うんうん、小口の場合は確かにphpですね。個人からの依頼や企業でも小規模なWEBページの依頼はphpが未だに多い印象。 php.netはそうなのよ、読み物としては立派なんだよね。phpの設定関連は読み込むと理解把握しやすい。一方で「この機能を実現する組み込み関数ってあるかな」と逆引きしたい時や、「ソース書いてて躓いた時、詰まった時」はあんまり役に立たない印象。 そこで次はどうするかというとネット記事(個人ブログ含)に行き着くん
だけど、php関連のネット記事って有象無象入り混じってて特殊なアプローチ(裏技的な内容)やセキュリティガバガバのソース提示されてるから初学者はネット記事参考にしない方が良い、というね。 やっぱり実際の業務で学ぶか、WordPress作って理解するか、GitHubで学ぶとかがいいかなーと思う http://mevius.5ch.net/test/read.cgi/tech/1663659983/931
932: デフォルトの名無しさん (ワッチョイ eb7b-1jHB) [sage] 2024/10/18(金) 14:05:17.56 ID:IRpwug8I0 >>931 内容については全文同意でいいが、>>924に戻ると、 php.netは読み物としてはMDN/MSDN/Oracleと比べて段違いにいいので、 紙好きであっても初手として通読する事を進める(他言語のリファレンスを想定しているのなら特に) どうしてもというなら全文印刷して読め、それくらい良質だ 一方で > php関連のネット記事って有象無象入り混じってて特殊なアプローチ(裏技的な内容)やセキュリティガバガバのソース提示されてるから初学
者はネット記事参考にしない方が良い これは本当にその通りで、理由はPHPが糞言語でろくなコードが書けないというのも多々あるが、(927参考) JSも相当に酷いので、「主戦場がWebなので(技術的/気分的に)『初心者にも』情報発信しやすい」のが主な理由だろう Web系は馬鹿しかいないというのも通説ではあるが、 実際の所Cなんて仕事化されない限り(例えば大学の準教授で講義内容を公開するとか)上級者でもWeb記事なんて書かないから、 記事書いてる時点で大半は教える事が仕事として成立する程度のフィルタがかかってるので全然違う (すまんがNGワード
規制に引っかかるようなのでバラバラに落とす) http://mevius.5ch.net/test/read.cgi/tech/1663659983/932
933: デフォルトの名無しさん (ワッチョイ eb7b-1jHB) [sage] 2024/10/18(金) 14:06:19.93 ID:IRpwug8I0 ではどうすればいいかといえば、俺は「レビュー済み」のコードを参考にする事を勧める http://mevius.5ch.net/test/read.cgi/tech/1663659983/933
934: デフォルトの名無しさん (ワッチョイ eb7b-1jHB) [sage] 2024/10/18(金) 14:07:10.73 ID:IRpwug8I0 俺は上記の通り、JSではMDNのコードしか信用しない事にしてるが、それは「MDNは多数に見られてる」からだ(=酷いコードは修正済み) StackOverflowが良質なのも、各回答がレビューされて上位順に並ぶからだ http://mevius.5ch.net/test/read.cgi/tech/1663659983/934
935: デフォルトの名無しさん (ワッチョイ eb7b-1jHB) [sage] 2024/10/18(金) 14:07:41.36 ID:IRpwug8I0 この点、php.netは同様に、各ページの下にコードがずらずらと『上位順』に並び、 結果的に各ページにStackOverflow並の上質なコードが付随する事になってる http://mevius.5ch.net/test/read.cgi/tech/1663659983/935
936: デフォルトの名無しさん (ワッチョイ eb7b-1jHB) [sage] 2024/10/18(金) 14:08:32.58 ID:IRpwug8I0 初学者であれを全部読むのは辛いだろうが、あのコードも読む価値があるので余裕があれば読むべき http://mevius.5ch.net/test/read.cgi/tech/1663659983/936
937: デフォルトの名無しさん (ワッチョイ eb7b-1jHB) [sage] 2024/10/18(金) 14:09:03.23 ID:IRpwug8I0 大体において各ページの機能のハマりポイントをコードで解説してある http://mevius.5ch.net/test/read.cgi/tech/1663659983/937
938: デフォルトの名無しさん (ワッチョイ eb7b-1jHB) [sage] 2024/10/18(金) 14:09:27.64 ID:IRpwug8I0 面倒なら、ハマったときにはググると同時にphp.netのその機能のコードも読む事だ http://mevius.5ch.net/test/read.cgi/tech/1663659983/938
939: デフォルトの名無しさん (ワッチョイ eb7b-1jHB) [sage] 2024/10/18(金) 14:10:14.73 ID:IRpwug8I0 ちなみに引っかかったらだいたいググるとQiitaで何とかなる事が多いはず Qiitaも勿論いいサイトではあるが、結局「上位順」ではないので、StackOverflowに成れなかった、というより成り損ねた感がある これは10年ほど昔にJS界隈でKenOkabe、通称「毛の壁」が、 細かい間違いを修正するよう突っ込みまくってウザがられて荒らし扱いされ、結局コメント機能が削除された、という経緯があるらしいが 結果的に「よりよいコード、より正しい情報を発信する
」(StackOverflow的価値観)より、 「僕が気持ちよく情報発信する」(ゆとり世代的価値観)を優先したので、そうなってる まあ創始者がゆとり世代だし、この判断が間違ってるかどうかも微妙で、例えば商業的意味なら「成功」となるのだが、 とにかく現状ではQiitaは玉石混淆、というよりゴミの方が多いので要注意 それでもないよりは100万倍いいので、素晴らしいサイトではあるけども http://mevius.5ch.net/test/read.cgi/tech/1663659983/939
940: デフォルトの名無しさん (ワッチョイ eb7b-1jHB) [sage] 2024/10/18(金) 14:11:06.01 ID:IRpwug8I0 これはQiitaのユーザーの問題というよりは、やはりレビューされてない事によるものだと思ってる 同様にGitHubでも個人レベルで公開してるのは、公開の場所が違うだけで、同様に糞コードの地雷原でしかない http://mevius.5ch.net/test/read.cgi/tech/1663659983/940
941: デフォルトの名無しさん (ワッチョイ eb7b-1jHB) [sage] 2024/10/18(金) 14:11:36.87 ID:IRpwug8I0 ただ世界的に超有名なOSS(勿論GitHub上)でも超絶糞コードな事に遭遇した事があるので、(なおC言語) OSSで多数に見られてればコードの質が上がる、ということでもないらしい http://mevius.5ch.net/test/read.cgi/tech/1663659983/941
942: デフォルトの名無しさん (ワッチョイ eb7b-1jHB) [sage] 2024/10/18(金) 14:11:54.86 ID:IRpwug8I0 結局はレビュワーによるのだが、OSSでレビューで落としたら関係がそれなりに悪くなるらしいので、 長期戦略を考えたら糞コードもなかなかに落としづらいというのはあるのかもしれない http://mevius.5ch.net/test/read.cgi/tech/1663659983/942
943: デフォルトの名無しさん (ワッチョイ eb7b-1jHB) [sage] 2024/10/18(金) 14:12:12.67 ID:IRpwug8I0 この点、PHP自体もOSSの産物だから、はっきり言って機能がデタラメで統一感もなく、 大手がガッツリ整備してる他言語(C#/Java等)と比べたら色々チグハグだが、 これもそういうものだと認識して諦めるしかない 文句があるならお前が直せ、のOSS文化そのままだ とはいえPHP8には表面的には機能が揃ってる感はあるが http://mevius.5ch.net/test/read.cgi/tech/1663659983/943
944: デフォルトの名無しさん (ワッチョイ eb7b-1jHB) [sage] 2024/10/18(金) 14:14:03.60 ID:IRpwug8I0 …多分「コード」がNGワードっぽい http://mevius.5ch.net/test/read.cgi/tech/1663659983/944
945: デフォルトの名無しさん (ワッチョイ 6b4a-yGIB) [sage] 2024/10/18(金) 18:47:58.42 ID:9d2rbs7t0 ここは毛の壁の落書き帳です http://mevius.5ch.net/test/read.cgi/tech/1663659983/945
946: デフォルトの名無しさん (ワッチョイ eb7b-1jHB) [sage] 2024/10/18(金) 20:59:29.50 ID:IRpwug8I0 実際の所俺は、毛の壁が超えた、ゆとり世代的レッドラインがどの程度なのかは知りたいんだけどね Qiita上では綺麗さっぱり消されてるので確認出来ないし まあ言いたい事は、 つべこべ言わずpnp.netを読め、そして各ページのコードも読め、だ 他言語の常識でpnp.netを忌避するのは、勿体なさ過ぎる http://mevius.5ch.net/test/read.cgi/tech/1663659983/946
947: デフォルトの名無しさん (ワッチョイ d274-nV0L) [sage] 2024/10/21(月) 10:50:17.35 ID:hAiZn1ip0 環境: PHP 8.3.6, ubuntu24.04 LTS, oniguruma 6.9.9 mb_ereg_replace() に使う正規表現の中で (*FAIL) が使えません PHP側で (*hoge) の形の正規表現パーツを無効化しているようですが もし使えるようにする方法があれば教えて下さい 最近 oniguruma に (*SKIP) が実装されたので正規表現の高速化のために使いたいです mb_ereg_replace() https://www.php.net/manual/ja/function.mb-ereg-replace.php http://mevius.5ch.net/test/read.cgi/tech/
1663659983/947
948: デフォルトの名無しさん (ワッチョイ 197b-QJZg) [sage] 2024/10/21(月) 11:21:53.55 ID:9J9C943n0 知らんが常識的にはdllを差し替えるだけでは? http://mevius.5ch.net/test/read.cgi/tech/1663659983/948
949: 947 (ワッチョイ d274-nV0L) [sage] 2024/10/21(月) 12:10:55.14 ID:hAiZn1ip0 >>948 ありがとうございます、PHPで使われている正規表現ライブラリは最新のものでした $ php -i | grep "onig" Multibyte regex (oniguruma) version => 6.9.9 PHP側が古い可能性もあるので一応 PHP 8.4.0 RC2 を試してみます http://mevius.5ch.net/test/read.cgi/tech/1663659983/949
950: デフォルトの名無しさん (ワッチョイ 197b-QJZg) [sage] 2024/10/21(月) 12:46:44.10 ID:9J9C943n0 >>949 6.9.9が最新ならお前は多分勘違いをしてるぞ > Master branch > Update Unicode version 16.0 > Add new operator (*SKIP) > > Version 6.9.9 > 以下略 > https://github.com/kkos/oniguruma この書き方なら、『開発中の』Master branch(=6.9.10としてリリースされるであろう物)には入ってるが、まだリリースされてない つまりどのPHPバージョンにも普通は入ってない だから自分でonigurumaをコンパイルして差し替
える必要がある http://mevius.5ch.net/test/read.cgi/tech/1663659983/950
951: 947 (ワッチョイ d274-nV0L) [sage] 2024/10/21(月) 13:48:46.27 ID:hAiZn1ip0 >>950 onigurumaの差し替えはやる予定でした、そこに気付かれるとは..すごい しかし (*FAIL) すら使えないのでonigurumaの差し替えをしても意味が無いんです 恐らくPHP側で無効にしていると思われるのですが有効にする方法をどなたか.. http://mevius.5ch.net/test/read.cgi/tech/1663659983/951
952: デフォルトの名無しさん (ワッチョイ 197b-QJZg) [sage] 2024/10/21(月) 14:34:37.43 ID:9J9C943n0 >>951 > やる予定 それは実際に試して言ってる? 一般的にdllは呼ぶだけで、その前の段階で前処理なんてしない というかそれやったら、PHP側のコードをonigurumaのバージョン毎に変えないといけなくなるだろ 無駄に依存性が増えるだけになってしまう 他ライブラリなんていつどう更新されるかも分からないのに だから普通は差し替えれば動くだけ 動かないのであり、かつその原因がそちらの予想通りPHP側にoniguruma特定バージョン用のパッ
チが当ててある場合は、 php.iniにそれを切る為の設定が(一般的には)あるはず でも繰り返すけど、普通はそうはせず、差し替えたら動くだけ、差し替えなければ動かないだけ、だと思うよ 動かないなら、そちらの設定間違いで、うまくdllを掴めてない可能性の方が高い 実際その(*FAIL)がどういう機能か知らんが、 (* 自体は対応してないとエラーになるでしょ 普通はそのエラー自体もライブラリ、つまりonigurumaやpeclに判定させて、throwさせるものだから http://mevius.5ch.net/test/read.cgi/tech/1663659983/952
953: デフォルトの名無しさん (ワッチョイ 197b-QJZg) [sage] 2024/10/21(月) 15:05:17.60 ID:9J9C943n0 >>952 訂正 × pecl ○ pcre 分かる範囲だがphpにはpeclもあるようなので… http://mevius.5ch.net/test/read.cgi/tech/1663659983/953
954: 947 (ワッチョイ d274-nV0L) [sage] 2024/10/21(月) 15:21:24.44 ID:hAiZn1ip0 >>952 >それは実際に試して言ってる? 実は最初から最新の Master branch (3237 commits) しか入れていません つまり oniguruma 6.9.9 のリリース版を使っていません このことを忘れてました、リリース版でも確認してみます、すみません.. そういうものですか、なるほど php.ini と oniguruma 側の確認もしてみます お時間取らせてしまって申し訳ないです、ありがとうございました http://mevius.5ch.net/test/read.cgi/tech/1663659983/954
955: デフォルトの名無しさん (ワッチョイ 197b-QJZg) [sage] 2024/10/21(月) 15:30:29.11 ID:9J9C943n0 >>954 > リリース版でも確認してみます いいね、これで確認出来る。差が出ればdllは当たってる あとは、サーバー側の設定は別のはずなので、コマンドでは動くがサーバー上では動かない場合はこれ http://mevius.5ch.net/test/read.cgi/tech/1663659983/955
956: デフォルトの名無しさん (ワッチョイ f2fc-opEg) [sage] 2024/10/21(月) 20:10:27.85 ID:QKrgL0if0 >947 preg_replaceで代替どうぞ $pattern = '/foo(*SKIP)(*FAIL)|bar/u'; $replacement = 'baz'; $subject = 'foobár'; $result = preg_replace($pattern, $replacement, $subject); echo $result; // foobaz http://mevius.5ch.net/test/read.cgi/tech/1663659983/956
957: 947 (ワッチョイ d274-nV0L) [sage] 2024/10/21(月) 20:30:30.28 ID:hAiZn1ip0 >>955 リリース版でも試しましたが結果は変わりませんでした、 (*FAIL) は使えませんでした リリース版でも Master branch の最新版でも oniguruma 単体では (*FAIL) を使えます php.ini にも (*FAIL) などを無効化するような設定は見当たりませんでした PHPをコンパイルする前のソースも見てみたのですが該当しそうな場所を見つけられていません しかしまだまだ調査不足なのでもっと調べてみます もしかしたら思いもよらない場所にある古い oniguruma ライブラ
リを参照している可能性もあります 何か分かりましたらまた来ます、今日は色々教えて頂きありがとうございました! http://mevius.5ch.net/test/read.cgi/tech/1663659983/957
958: 947 (ワッチョイ d274-nV0L) [sage] 2024/10/21(月) 21:31:17.66 ID:hAiZn1ip0 >>956 すいません!レスに気付いてませんでした! 頂いたコードで (*SKIP)(*FAIL) が正しく動作しているのを確認出来ました しかし私は mb_ereg のほうを使わなければなりません、正規表現で UTF-8 以外の エンコードを使うためです、せっかく作って頂いたのに申し訳ない.. > á おお、 /u はこんな挙動するんですね、勉強になります http://mevius.5ch.net/test/read.cgi/tech/1663659983/958
959: デフォルトの名無しさん (ワッチョイ 0601-opEg) [sage] 2024/10/22(火) 07:31:12.59 ID:frvkcjlG0 >958 なるほどね理解しました。根本的な解決に向けての助力は他の方が回答してくれてるので、俺は一時的な回避策(w)を提示するよ。その場凌ぎなので悪しからず $original_encoding = 'SJIS'; // 例: Shift-JIS など // 文字列を一時的に UTF-8 に変換 $subject = mb_convert_encoding($subject, 'UTF-8', $original_encoding); // preg_replace を利用して (*SKIP)(*FAIL) を使った正規表現を適用 $pattern = '/foo(*SKIP)(*FAIL)|bar/u'; $r
eplacement = 'baz'; $result = preg_replace($pattern, $replacement, $subject); // 結果を元のエンコーディングに戻す $result = mb_convert_encoding($result, $original_encoding, 'UTF-8'); echo $result; http://mevius.5ch.net/test/read.cgi/tech/1663659983/959
960: デフォルトの名無しさん (ワッチョイ 197b-QJZg) [sage] 2024/10/22(火) 08:51:20.86 ID:OD5ng7w50 >>957 それだと、用意したdllは使われておらず、どこかにある古いonigurumaを掴んでいるように見えるな なら、今掴まれているdllを特定して、そのファイルと差し替えるのが一番早いかと windowsなら実行中の各プロセスがどのdllファイルを掴んでいるかはprocessExplororで簡単に分かるが、 Unixだと聞いたことない(…が、あるんだろうけど) ググるとlddで静的解析は出来るらしい(使ったこと無いが) ただこれは自分でコマンドとして起動する場
合用だから、 apache/nginxを起動してるユーザーで実行すれば命中するが、ただのユーザーではいまいちだな https://stackoverflow.com/questions/50159/how-to-show-all-shared-libraries-used-by-executables-in-linux https://linux.die.net/man/1/ldd (実際色々変わってるらしいので何ともだが、昔と同様の起動形態だと、 rc*.dを改変してapache起動直前にlddすれば確定する《はず》) あと、xampp環境だと php_mbstring.dll というものがある これがonigurumaかどうかは分からないが、そうだった場合、php_*となっているのは通常、 「そのものでは
なく、php側が用意したラッパをつけた状態でdllにした」ことを意味するので、 oniguruma単体ではなく、ラッパつけて再コンパイルする必要があるかも http://mevius.5ch.net/test/read.cgi/tech/1663659983/960
961: 947 (ワッチョイ d274-nV0L) [sage] 2024/10/22(火) 21:24:40.11 ID:u1LoTuab0 書き込み規制が出たので簡素化して書きます mb_ereg_replace() で (*FAIL) が動かない原因は oniguruma のライブラリの バージョンが古いという問題ではありませんでした oniguruma 6.6.0 で追加された (?W) が使えない一方で 6.9.5 で追加された \x{HHHH HHHH} が使えるなどバージョンの違いでは説明出来ない動作がたくさん確認出来ました この問題は恐らく解決が困難だと思うので諦めます お二方、お付き合い頂きありがとうございました、勉強になりました、感謝です
http://mevius.5ch.net/test/read.cgi/tech/1663659983/961
962: デフォルトの名無しさん (ワッチョイ 197b-QJZg) [sage] 2024/10/22(火) 22:48:01.75 ID:OD5ng7w50 >>961 お疲れ すんなり行かない場合はかなりハマる案件なので、判断は妥当だと思う なおオープンソースの新機能周りってわりと普通にバグってるので、意味不明な場合はこれかも http://mevius.5ch.net/test/read.cgi/tech/1663659983/962
963: デフォルトの名無しさん (ワッチョイ 197b-QJZg) [sage] 2024/10/23(水) 06:42:46.86 ID:/9Lix2oc0 >>961 そういえば書き込み規制の件、 もしまだ原稿が手元に残ってるなら、 多少読みにくくてもいいから、バラバラにするなり、他板のテストスレに落とすなりしてもらえないだろうか 情報が有るのと無いのでは全然違うので、俺は読むから コピペ規制なら、例えばmango板は規制チェックの為の板なので、落とせるし agree.5ch.net/test/read.cgi/mango/1715675838/ http://mevius.5ch.net/test/read.cgi/tech/1663659983/963
964: 947 (ワッチョイ d274-nV0L) [sage] 2024/10/23(水) 14:05:07.85 ID:ETlmKTT60 現時点では php-mbstring の問題だと思っています これはPHPに後から追加するPHPの拡張モジュールです、このモジュールが oniguruma の ライブラリのファイルを参照します oniguruma は各正規表現パーツごとに有効、無効を切り替えられる仕様になって いるのですが、oniguruma を呼び出す php-mbstring 側で (?W) や (*FAIL) が 有効にされていない可能性が高いと考えています 以下のページは oniguruma の各パーツごとのオプション名を説明するページです s://github.
com/kkos/oniguruma/blob/master/doc/SYNTAX.md このページを "Set in:" でページ内検索すると各パーツがどのプログラム言語用の 正規表現ルールに適用されるかが分かります (?W) は 30番目の ONIG_SYN_OP2_OPTION_ONIGURUMA というオプションを 有効にすると使えるのですが、これが適用されるルールは 「Set in: Oniguruma」と 書いてあるので正規表現ルールを "Oniguruma" と指定しないと使えません しかし php-mbstring のソースを見てみると選べる正規表現ルールの中に "Oniguruma" は ありませんでした、つまり
正規表現ルールを "Oniguruma" に変更出来れば (*FAIL) なども 使えるようになる可能性があります(そう簡単に上手くいくとも思えませんが) http://mevius.5ch.net/test/read.cgi/tech/1663659983/964
965: デフォルトの名無しさん (ワッチョイ f281-XFgw) [sage] 2024/10/23(水) 14:05:25.05 ID:uHtllYPK0 その辺まで行くとissue読み漁らないとたどり着かない領域かもね http://mevius.5ch.net/test/read.cgi/tech/1663659983/965
966: 947 (ワッチョイ d274-nV0L) [sage] 2024/10/23(水) 14:43:46.47 ID:ETlmKTT60 あと、話を簡素化するために嘘を書いてしまったので訂正します php-mbstring ライブラリが参照している oniguruma ライブラリを教えて頂いた ldd コマンドで調べたところ、以下のように別ファイルを参照していました php-mbstring が参照していたパス /usr/lib/x86_64-linux-gnu/libonig.so.5.4.0 私が入れた oniguruma ライブラリのパス /usr/local/lib/libonig.so.5.4.0 php-mbstring が参照していたライブラリのファイルサイズは私が入れたライブラリの 半分ほどだ
ったので恐らく古いライブラリだったのだと思います そこで php-mbstring が参照しているライブラリを最新の Master branch のライブラリに 置き換えて (*FAIL) が使えるかを試してみましたが結果は変わらず、使えないままでした >>948 でご指摘して頂いたことは的を射ていたということになります お詫びして訂正致します、すみませんでした http://mevius.5ch.net/test/read.cgi/tech/1663659983/966
967: デフォルトの名無しさん (ワッチョイ 197b-QJZg) [sage] 2024/10/23(水) 22:17:15.79 ID:/9Lix2oc0 >>966 いや全く謝る必要はない その辺まで行ってる時点で大したもんだし、よく言われてる「報告」についても、君はよく出来てるよ > oniguruma は各正規表現パーツごとに有効、無効を切り替えられる仕様になって > いるのですが、oniguruma を呼び出す php-mbstring 側で (?W) や (*FAIL) が > 有効にされていない可能性が高いと考えています なるほど、これを知ってたから最初から無効化を疑ってたわけね 俺は知らなかったから、一
般論で答えてしまったが 正規表現の場合は互換性が問題になるから一々細かくやらないと駄目なのかもね > 正規表現ルールを "Oniguruma" と指定しないと使えません これは微妙にちと違っていて、あの書き方だとただ単にフラグだから、C的にありがちなのは、以下α (最近使ってないなら文法間違ってるかもだが) 多少行儀のいい場合:α #define ONIG_SYN_OP2_OPTION_ONIGURUMA 0x04000000 // oniguruma内 onigSyntaxType.op2 |= ONIG_SYN_OP2_OPTION_ONIGURUMA; // php_mgstring内 あるいはドベタに:β onigSyntaxType.op2 |= 0x400000
00; // php_mbstring内 "Oniguruma"指定の場合は、多分:γ OrigSyntaxType Oniguruma = {0xfff7d556, 0x47eb7bd2, 0x87a00bdb}; // oniguruma内 OrigSyntaxType origSyntaxType = Oniguruma; // php_mbstring内 要するにビットを立ててるだけなので、op2の[30]を立ててしまえば使えるようになる Oniguruma指定は一番手抜きが出来て楽だが、 php_mbstringの機能追加タイミングがOnigurumaのバージョンアップと同期してしまう だから互換性を重視しつつ、必要なタイミングで上位機能を取り込みたい場合は、普通はαにする そして結果的にOn
iguruma指定と同じになる事を(長期的に)目指す http://mevius.5ch.net/test/read.cgi/tech/1663659983/967
968: デフォルトの名無しさん (ワッチョイ 197b-QJZg) [sage] 2024/10/23(水) 22:18:06.80 ID:/9Lix2oc0 なので検索する場合は、Onigurumaが無ければ、 ONIG_SYN_OP2_OPTION_ONIGURUMA を探し、それもなければ 0x を探す(一応0Xでもいいらしいのでそれも) とまあ、ここまで書いてると、「そこまで言うならお前が見ろや!」なので見てみる 最新版とか知らんのでpnp.netのdownloadページの8.3.12をDLした(CurrentStable) ああ俺は、他人のコードを読み足りない、と認識してるから、こういう機会があれば読む事にしているだけだ 今風に言えば、べっ別に、
あんたの為に読んだ訳じゃないんだからね!!!(だが男だ) さて上記検索試すが、空振る。そして後付ではあるが php-8.3.12>grep -n -r -i OnigSyntaxType * ext/mbstring/php_mbregex.c:62: OnigSyntaxType *regex_default_syntax; ext/mbstring/php_mbregex.c:455:static php_mb_regex_t *php_mbregex_compile_pattern(const char *pattern, size_t patlen, OnigOptionType options, OnigSyntaxType *syntax) ext/mbstring/php_mbregex.c:489:static size_t _php_mb_regex_get_option_string(char *str, size_t len, OnigOptionType option, O
nigSyntaxType *syntax) ext/mbstring/php_mbregex.c:595: OnigSyntaxType **syntax) ext/mbstring/php_mbregex.c:997: OnigSyntaxType *syntax; ext/mbstring/php_mbregex.c:1268: OnigSyntaxType *syntax; ext/mbstring/php_mbregex.c:1332: OnigSyntaxType *syntax; ext/mbstring/php_mbregex.c:1463: OnigSyntaxType *syntax = NULL; ext/mbstring/php_mbregex.c:1591:static void _php_mb_regex_set_options(OnigOptionType options, OnigSyntaxType *syntax, OnigOptionType *prev_options, OnigSyntaxType **prev_syntax
) ext/mbstring/php_mbregex.c:1608: OnigSyntaxType *syntax, *prev_syntax; 当たり前だが、変化する値側ではなく、固定的な型名で検索するべきだった http://mevius.5ch.net/test/read.cgi/tech/1663659983/968
969: デフォルトの名無しさん (ワッチョイ 197b-QJZg) [sage] 2024/10/23(水) 22:19:18.35 ID:/9Lix2oc0 そして順当なら php_mbregex.c:1591:static void _php_mb_regex_set_options なので見てみる prevをデフォに戻して新しい値をセットするだけのようだ そもそもprevが何故いるのか?はかなり疑問だが、まあいい とにかくビットを立ててしまいたいだけなら、ここを改造して、上記βしてしまえば、ここを通る限り常にビット30が立つようになる コンパイル通るかどうか知らんが、例えば具体的には、 MBREX(regex_default_options) = options; MBREX(reg
ex_default_syntax) = syntax; (*syntax)->op2 |= 0x40000000; // これを最後に追加 MBREXはマクロ #define MBREX(g) (MBSTRG(mb_regex_globals)->g) MBSTRGもマクロ mbstring.h:118:#define MBSTRG(v) ZEND_MODULE_GLOBALS_ACCESSOR(mbstring, v) ZEND_MODULE_GLOBALS_ACCESSORもマクロ Zend/zend_API.h:255:#define ZEND_MODULE_GLOBALS_ACCESSOR(module_name, v) ZEND_TSRMG(module_name##_globals_id, zend_##module_name##_globals *, v) Zend/zend_API.h:270:#define ZEND_MODULE_GLOBALS_ACCESSOR(module_name, v) (module_name##_glob
als.v) 2つ出るのは#ifdefと相場が決まっており、今回も#ifdef ZTS らしいが、ZTSってなんだっけ? まあとにかくこの辺はここまででいい、とにかく更新してるだけっぽいし http://mevius.5ch.net/test/read.cgi/tech/1663659983/969
970: デフォルトの名無しさん (ワッチョイ 197b-QJZg) [sage] 2024/10/23(水) 22:21:26.39 ID:/9Lix2oc0 その他、 ext/mbstring/php_mbregex.c:489:static size_t _php_mb_regex_get_option_string ext/mbstring/php_mbregex.c:594:static bool _php_mb_regex_init_options とか、いかにもなので君には分かるだろう 真面目に直すのならこの辺だね ちなみに regex_default_syntax を修正してもいけるはず。これは ext/mbstring/php_mbregex.c:84:pglobals->regex_default_syntax = ONIG_SYNTAX_RUBY; とモロクソに書いてある 君の読み通りなら、そこを
pglobals->regex_default_syntax = ONIG_SYNTAX_ONIGURUMA; // RUBYからONIGURUMAに変更 ついでに ext/mbstring/php_mbregex.c:601:*syntax = ONIG_SYNTAX_ONIGURMUA; // RUBYからONIGURUMAに変更 なのだろうね grep -n -r ONIG_SYNTAX * でONIG_SYNTAX_RUBYが引っかからないから、おそらくONIG_SYNTAX_RUBYはoniguruma側で定義されてる だからoniguruma側で同様にgrepして ONIG_SYNTAX_ONIGURUMA が定義されてればいけるかも てかこれ見る限り、毎回initしてるのか?(まあdllならそうかもだが) そして _php_mb_regex_init_options内case '*' の
部分をphp.iniかどこかで設定出来るようにしてるはずではあるが ただ普通に考えて、prev_syntaxって何ぞ?ではある regexで「今回の」文法を切り替えるのは分かるが、「前回の」は明らかに要らないので、 それがある=何か無理矢理切り替えて動かしてる感あり、なので、単純にビット立てるだけでは駄目かもよ ダラダラ書いたけどこんな感じ とはいえ、君はほぼ辿り着いてるよね php_mbstringのコンパイル環境の立ち上げがすんなり行くかはやってみないと分からないが http://mevius.5ch.net/test/read.cgi/tech/1663659983/970
971: デフォルトの名無しさん (ワッチョイ 197b-QJZg) [sage] 2024/10/23(水) 22:21:59.96 ID:/9Lix2oc0 あとついでに言うと、推定だが、順当には、 当初:php->onigurumaを直接呼び出し おそらくonigurumagaの更新でAPIが変わって、 現在:php->php_mbstring->oniguruma と呼び出し、 php->php_mbstring間のAPIは固定、 php_mbstring->onigurumaでonigurumaのAPI変更に対応、 つまりonigurumaが変更されてもphp_mbstringの変更のみで対応し、php 本体は一行も変更無しでいけるように分離した、 だと思うので、君の予想する「oniguruma
用に何かしてるコード」はphp_mbstring側に全部突っ込まれてるはず まあこれも一般論だが http://mevius.5ch.net/test/read.cgi/tech/1663659983/971
972: デフォルトの名無しさん (ワッチョイ 197b-QJZg) [sage] 2024/10/23(水) 22:31:46.47 ID:/9Lix2oc0 >>967 分かる範囲だが一応訂正 × (最近使ってないなら文法間違ってるかもだが) ○ (最近使ってない か ら文法間違ってるかもだが) http://mevius.5ch.net/test/read.cgi/tech/1663659983/972
973: デフォルトの名無しさん (ワッチョイ 197b-QJZg) [sage] 2024/10/23(水) 22:52:29.22 ID:/9Lix2oc0 さらについで ONIG_SYNTAXは仕様としては任意のビットを立てたり落としたり出来るはずだが、 実際はこの手の奴は大体テストが甘くて、組み合わせによっては動作しなかったりする ではどうするか?と言えば、テスト済みであろう組み合わせに出来るだけ近い物を使う 今回ならRUBYかONIGURUMAに一番近いものだが、まあ、両方とも似たり寄ったりだな しかしよく見ると、RUBY 指定なら ONIG_SYN_OP2_ASTERISK_CALLOUT_NAME は立ってるではないか php_mbst
ringのソースだけ見るとデフォはRUBY指定だから動くはず となると何らかの理由で _php_mb_regex_init_options で他指定に切り替えられてるのか? ならば手抜きで直すなら、 ext/mbstring/php_mbregex.c:607-656を全部コメントアウトして case 文を無視、 何をどう指定されても ONIG_SYNTAX_RUBY(あるいはONIG_SYNTAX_ONIGURUMA) になるようにしてしまうとか、かな http://mevius.5ch.net/test/read.cgi/tech/1663659983/973
974: デフォルトの名無しさん (ワッチョイ 197b-QJZg) [sage] 2024/10/23(水) 23:37:30.51 ID:/9Lix2oc0 >>964 てゆうかすいません、モロクソに書いてましたわ dllだけ差し替えて'r'指定で行けるはずですわ もうちょっと眺めて投稿すべきだった(これもかもだが) (すまぬが引っかかるのでバラバラに落とす) http://mevius.5ch.net/test/read.cgi/tech/1663659983/974
975: デフォルトの名無しさん (ワッチョイ 197b-QJZg) [sage] 2024/10/23(水) 23:40:00.93 ID:/9Lix2oc0 _php_mb_regex_init_options は各関数で毎回呼ばれてる (_php_mb_regex_ereg_replace_execからも) http://mevius.5ch.net/test/read.cgi/tech/1663659983/975
976: デフォルトの名無しさん (ワッチョイ 197b-QJZg) [sage] 2024/10/23(水) 23:41:25.78 ID:/9Lix2oc0 そしてこれをPHPから呼ぶのが mb_regex_set_options で、 http://mevius.5ch.net/test/read.cgi/tech/1663659983/976
977: デフォルトの名無しさん (ワッチョイ 197b-QJZg) [sage] 2024/10/23(水) 23:42:52.32 ID:/9Lix2oc0 > Regex 構文モード(ひとつだけ設定可能です) http://mevius.5ch.net/test/read.cgi/tech/1663659983/977
978: デフォルトの名無しさん (ワッチョイ 197b-QJZg) [sage] 2024/10/23(水) 23:43:08.35 ID:/9Lix2oc0 > https://www.php.net/manual/ja/function.mb-regex-set-options.php とモロクソ書いてますな そして何故かそのphp.netページにはデフォが何か書いてないが、 'r'指定すればRUBY指定(=ONIG_SYN_OP2_ASTERISK_CALLOUT_NAMEがON)になる 'p'指定でもいけるかも? そしてこのフラグは mb_ereg_replace でも使えるらしい。つまり、 mb_ereg_replace( string $pattern, string $replacement, string $string, ?string $options = null <- ここに指
定、例えば 'r' or 'p' ): string|false|null これで使えるなら、dllだけ差し替えればC側の修正は不要(そして多分これで上手く行く) http://mevius.5ch.net/test/read.cgi/tech/1663659983/978
979: デフォルトの名無しさん (ワッチョイ 197b-QJZg) [sage] 2024/10/23(水) 23:43:51.89 ID:/9Lix2oc0 それでも駄目、或いはRUBY指定やPERL指定では使えない機能も使いたいなら、 _php_mb_regex_init_optionsに case 'o': *syntax = ONIG_SYNTAX_ONIGURUMA break; を追加して、'o'指定してやるとかすればいけるはず 敗因は、oniguruma側で細かくregexを切り替えられる事を知らない人にとっては > Regex 構文モード(ひとつだけ設定可能です) とか意味不明だからだな 最初にそこを言ってくれてれば、ピンと来た人がいたかも? http://mevius.5ch.net
/test/read.cgi/tech/1663659983/979
980: デフォルトの名無しさん (ワッチョイ 197b-QJZg) [sage] 2024/10/24(木) 01:07:24.54 ID:D6fJlQ4l0 >>978 訂正、perlなので' p と思ってしまってたが z だった orz × 'p'指定でもいけるかも? ○ 'z'指定でもいけるかも? × 例えば 'r' or 'p' ○ 例えば 'r' or 'z' あと var_dump(mb_regex_set_options(null)); でデフォを確認出来る 多分 "r" と出るはず あと >>973 > しかしよく見ると、RUBY 指定なら ONIG_SYN_OP2_ASTERISK_CALLOUT_NAME は立ってるではないか > php_mbstringのソースだけ見るとデフォはRUB
Y指定だから動くはず の部分も一部訂正だが、これは俺だけが悪いのではなく、GitHubのSYNTAXページも間違ってるな 上側の説明部分では > 28. ONIG_SYN_OP2_QMARK_BRACE_CALLOUT_CONTENTS (enable (?{...})) > Set in: Oniguruma, Perl, Perl_NG > 29. ONIG_SYN_OP2_ASTERISK_CALLOUT_NAME (enable (*name)) > Set in: Oniguruma, Perl, Perl_NG となってて、Onigurumaならフル機能のように書かれてるが、下の表だと 28,29はOnigurumaでは付いてない まあどっちが正しいのかは謎だが、意味不明な挙動するのはこの辺の問題もあるかもよ こ
れでは結局の所、RUBYやONIGURMUA指定で欲しい機能(29と30か?)が動くかどうかがよく分からんし (まあ自前で立ててやればいいんですけどね) http://mevius.5ch.net/test/read.cgi/tech/1663659983/980
981: 947 (ワッチョイ d274-nV0L) [sage] 2024/10/24(木) 12:35:15.79 ID:CfDH66X40 ありがとうございます、おかげ様でゴールが見えてきた感じです すごい解析力に脱帽でした、読みながら「すごいな〜」を連発してしまいました ちょっと昔に DAN KOGAI さんを見たときも衝撃を受けましたがそんな感じでした 本当は (*FAIL) が動くのを確認してからレスしたかったのですが 何かにハマっているらしくまだ成功していません しかしもう PHP の問題というより oniguruma の問題ですので ここから先は自力でなんとかなりそうです > 28. 29. これは表
が間違ってます、以下は ONIG_SYNTAX_RUBY のオプション指定です https://github.com/kkos/oniguruma/blob/43a8c3f3daf263091f3a74019d4b32ebb6417093/src/regparse.c#L122-L162 #define ONIG_SYNTAX_RUBY (&OnigSyntaxRuby) https://github.com/kkos/oniguruma/blob/43a8c3f3daf263091f3a74019d4b32ebb6417093/src/oniguruma.h#L444 今は (*FAIL) が使えるようになるかの手っ取り早い確認のために oniguruma ライブラリ側をいじり、 上記の ruby のオプション指定に oniguruma のものをコピペして動くかどうかを試していますが 今のところ結果が変
わりません (ライブラリの置き換えに失敗している?) ちょっと日数がかかるかも知れませんが成功したらご報告に伺います、ありがとうございました! http://mevius.5ch.net/test/read.cgi/tech/1663659983/981
982: デフォルトの名無しさん (ワッチョイ 197b-QJZg) [sage] 2024/10/24(木) 22:06:48.35 ID:D6fJlQ4l0 >>981 > これは表が間違ってます 確認した。md打つときに列が一個ずれて、onigがyesになるべき所がRubyの列に入ってるんだな 誰か余裕があったら指摘してあげて > 上記の ruby のオプション指定に oniguruma のものをコピペして動くかどうかを試していますが いいね。この方が早そうだ > ちょっと日数がかかるかも知れませんが成功したらご報告に伺います、ありがとうございました! はいまあ頑張って ちなみに1つバグ、というか
不一致を発見した php_mbregex.c内、_php_mb_regex_init_options関数で、単純にRubyの r 指定等すると上書きしている為、 『最初に』指定しないと正しく動作しない(それ以前に指定したフラグが全部キャンセルされる) しかしphp.netには『最後に』と明記してある > モードを設定する際には、モード文字は最後に指定しなければなりません。 > https://www.php.net/manual/ja/function.mb-regex-set-options.php これも誰か余裕有ったら指摘してあげて。勿論報告者の手柄にしていい 本来はPCRE側、つまりpreg_replaceと同様にすべき となると多分
フラグの順は問わないので、 2パスにして1周目でRegex構文モードを、2周目で各フラグを設定するようにCを修正するのが正しい ドキュメント修正で済ませる場合は上記の通り、『最後に』と修正すれば終了 (Cの修正案が要るなら俺が書いてもいい、が、手続きとか知らんし面倒だから誰かやってくれ、勿論報告者が発見した事にしていい) だからまあ、挙動不審なのはもしかするとフラグの指定順がまずいのかも http://mevius.5ch.net/test/read.cgi/tech/1663659983/982
983: デフォルトの名無しさん (ワッチョイ 197b-QJZg) [sage] 2024/10/24(木) 22:08:58.49 ID:D6fJlQ4l0 > すごい解析力に脱帽でした お世辞乙だがマジレスすると、実は普通に読めて、それがOSSの定義だったりするので、そんなにすごくもない phpも30年間OSSとしてずっとメンテされており、当たり前だが多くの人が読めるからメンテ出来てる だから逆に言えば、読めないコードはOSSとしては生き残れないし、30年は淘汰に十分な期間ではある よって、長寿OSS、つまりphpやGNUやLinuxは、OSSに参戦するレベルの連中ならある程度読めて当然で、 「僕が読め
ないから汚いコ ードだ」と寝言ほざいてる奴には「お前の頭がOSSの域に達してないだけだ馬鹿タレ」と返していい ただ読めると言っても実際に読んでいるわけではなくて、 この仕様ならこういう作りだろうなという予測通りになっているのをなぞっているだけ だから逆に、初心者や、まだ淘汰されてないOSSのコ ードとかは、普通に読めない (読む価値無いから無視でいいのだが) だから今回は > 以下のページは oniguruma の各パーツごとのオプション名を説明するページです これが大きかった そしてこれがpnp.net上のRegex構文モードと対になってるの
が分かると、なるほどね、となった まあ結局、一通り出来るようになって、書くのには苦労しなくなると、あとは仕様の理解度で差が出る、ということ php_mbregexのコ ードは悪いコ ードではないね 愚直にやってるだけのドベタなコ ードで、すごくもないが、でもこういうコ ードがOSSとしては長生きするのだろうよ (変な改行はNGワード逃れ) http://mevius.5ch.net/test/read.cgi/tech/1663659983/983
984: 947 (ワッチョイ d274-nV0L) [sage] 2024/10/25(金) 21:53:01.03 ID:hP0G6XWW0 > OSSに参戦するレベルの連中ならある程度読めて当然 これが出来るようになることがどれだけすごいことか.. ここでこうやって語って下さるだけでも私含め誰かのためになるめちゃめちゃ 貴重な存在ですよ、いつまでも元気で現役して下さい! > OSS 淘汰 後で手を入れる人のことまで考えてコーディングされていたんですね そこまで考えてませんでした、目からうろこです > 間違いの報告 私はC言語を知らないので間違いの確認作業が出来るか自信がありませんが
確認出来たら 報告しに行きますね (ここの回答者様のほうが適任だと思いますのでどなたか余力のある方は是非..) http://mevius.5ch.net/test/read.cgi/tech/1663659983/984
985: デフォルトの名無しさん (ワッチョイ 197b-QJZg) [sage] 2024/10/26(土) 20:57:24.64 ID:BX88EvoL0 >>984 > 私はC言語を知らないので それでソースファイル当たるとは勇者だな。ただ姿勢としては正しい ソースなんて読める読めないではなく、読む読まないだし、 そもそも読めない奴こそ勉強になるから読めであり、 読める奴(=そのコード構成が自分でも組める奴)が読んでも得る物はあまりない > 間違いの確認作業が出来るか自信がありませんが確認出来たら > 報告しに行きますね Cに関しては俺がフォロー出来るが、それ以前にバグっ
て無さそう(すまんが俺の勘違いっぽい) よく見ればフラグは optm |= で溜めてて、文法の切り換えは *syntax = なので上書きしてない だから正確には、 × モード文字は最後に指定しなければなりません。 (現在の表記) ○ 最後に指定したモード文字が有効になります。 ではあるが、現在の表記でも問題はないはず なおonigurumaの表の間違いはGitHubのissuesに凸すれば多分本人(kkos)がすぐ直してくれる そちらはonigurumaをよく知ってるみたいなので、こちらはやってみてどうぞ http://mevius.5ch.net/test/read.cgi/tech/1663659983/985
986: 947 (ワッチョイ 3374-ohr8) [sage] 2024/10/27(日) 14:13:33.60 ID:heVNiBfi0 > そもそも読めない奴こそ勉強になるから読めであり そうですね、読んでて色々勉強になってます 書けと言われたらさっぱりですが読むほうでは少しだけ進歩したな、とは感じます > それ以前にバグって無さそう これは良かったです、正直私には荷が重かったのでw > モード文字は最後に指定しなければなりません これは mbstring の作者さんが意図するところがはっきり分からないので悩みます 「最後の文字だけ取り出せば指定されているモードが分かる」という仕
様に することを視野に入れているのかも知れませんし.. 一応英語のページも見ましたが日本語と同じ意味で書いているようです https://www.php.net/manual/en/function.mb-regex-set-options.php > oniguruma の表 この SYNTAX.md は oniguruma 作者さんが作ったページではなく第三者が作ったものを マージしたものらしく、ページが作られてから1年弱で更新が止まってます https://github.com/kkos/oniguruma/commits/master/doc/SYNTAX.md 最後の更新から5年近く経っていて情報も古くなっています 私がやるならこのページを oniguruma 6.9.9 の
ものに更新します しかし今は php で (*SKIP) を動かすことを目指しているのでその後にやりますね oniguruma で指定されている option を読み込んであの表を出力するプログラムが あったら便利そうです、いつか作るかも知れません http://mevius.5ch.net/test/read.cgi/tech/1663659983/986
987: デフォルトの名無しさん (ワッチョイ 497b-vCJ4) [sage] 2024/10/28(月) 10:05:20.25 ID:l7XbYqqi0 >>986 言い方が悪かったかもしれないが、php.netの表記は直す必要がない。(直すべきではない) プログラミング等においては、 ドキュメント記載の動作範囲⊆実際の動作範囲 である事は絶対に必要だが、書いてない範囲は動いても動かなくても問題ないから。 (今回は、最後に書けば確実に動くので問題ない。 記載を変更したら何か変更があったかと勘ぐられ、余計におかしくなる) だからphp側については今回は何もする必要がない。 > これは
mbstring の作者さんが意図するところがはっきり分からないので悩みます これはちと違ってて、仕様は実装に依存すべきではないし、してはいけない。 というか、仕様を変更するとこれまで動いてたコートが動かなくなる(=互換性が無くなる)可能性が出てくるので、 原則として、仕様は追加は出来るが削除は出来ない。 逆に実装は変わるものだし、(互換性を保たれている限り)変わってもいいものだ。 だから仕様が実装に依存した場合、初期実装は楽だが、わりと早々に破綻する。 よって、本来は、最初の最初に仕様を未来永劫変更せずに済むレベルまで練る
べきだし、 多少実装が困難な仕様でも、それが良い仕様なら、頑張って実装するしかない。 (主従関係でいえば、仕様が主で実装が従) http://mevius.5ch.net/test/read.cgi/tech/1663659983/987
988: デフォルトの名無しさん (ワッチョイ 497b-vCJ4) [sage] 2024/10/28(月) 10:05:40.31 ID:l7XbYqqi0 ただ、 ○ ドキュメントを読めば使える ◎ ドキュメントを読まなくても使える なので、今回はグダグダ言わずにpcreと全て揃えるのが理想で、目指す所は 既存のコードを mb_* とするとマルチバイト対応になるだけで、全て動く、ではあるが、 現実的には無理だし、phpの場合は仕様自体がわりとグダグダなので、 多少でも綺麗にしていく為には新規部分は(従来の汚い仕様を無視して)綺麗に作るしかなく、 まあ許容範囲だと思うよ。 見た目、 A, 元
々は記載通り「最後に書く必要があった」が、pcreと揃えるよう修正して「いつ書いても動く」ようになった B. 元々何も記載無かったが、複数書いた場合等の動作が曖昧になるので、 「確実に動く条件」を記載するように求められ、書いた ように見える。 なお仕様を自由に決めて良いなら、 そもそも「モード」を「フラグ」に突っ込むべきなのか?という話で、 (php.netでは纏めて「オプション」「パターン修飾子」と呼称されてるので曖昧になってる) 例えばJSなら String.replace(/regular expression/flags, replacement, mode); // modeでRubyやoni
gurumaモードを切り替える で終わってた気がするし、 これなら「ひとつしか指定出来ません」「最後に指定しなければなりません」はそもそも必要なくなる。 しかし使いもしない引数を無駄に増やすのもよろしくないし、フラグに突っ込んでしまえ、の判断もありだろう。 (pcreもそうなってるし) http://mevius.5ch.net/test/read.cgi/tech/1663659983/988
989: デフォルトの名無しさん (ワッチョイ 497b-vCJ4) [sage] 2024/10/28(月) 10:05:57.25 ID:l7XbYqqi0 > しかし今は php で (*SKIP) を動かすことを目指しているのでその後にやりますね それで正しい。義務感でやるものではないし、面倒なら放置でいい。 (というかこの位緩くないと続かない。だいたい昨今のSNS疲れとかは義務感から来てるものだし) だからまあ、「この表は自分も今後とも使うので正確であって欲しい。 とりあえず自分用に更新版作ったから上げとく」位でいい。 そしてそれをpythonにやらせたのなら、それもついでに上げとく、程度で
十分だ。 http://mevius.5ch.net/test/read.cgi/tech/1663659983/989
990: デフォルトの名無しさん (ワッチョイ 7b5f-kvRr) [sage] 2024/10/29(火) 00:01:17.52 ID:R9Dn8Crp0 堂島の龍・・・ って言ったんだ http://mevius.5ch.net/test/read.cgi/tech/1663659983/990
991: 947 (ワッチョイ 3374-ohr8) [sage] 2024/10/29(火) 11:56:37.23 ID:FIsrbLEd0 > php側については今回は何もする必要がない 了解です、これは分かってましたので大丈夫です > 原則として、仕様は追加は出来るが削除は出来ない 言われてみれば確かに.. 実装を仕様にしたせいで実際に破綻した経験もあったり(ぉぃ) > pcreと全て揃えるのが理想 確かにそうですね > A. B. なるほど、"仕様が主" ということを考えると納得の推察です > フラグに突っ込んでしまえ それでオプションとモードが混ぜてあったんですねw > 義
務感でやるものではない そうですね、でも SYNTAX.md の更新は私がやりたいと思ってるのでやると思います ミスが出ないように少しづつ進めるつもりです、なので完成は来年になるかも知れません ただ、私にはオプションの説明文は書けないのでソースのコメントをコピペするだけの 手抜きになると思います ( "説明文 == 仕様" なので ) PHP で (*SKIP) を使えるようにする件もあと少しでなんとかなりそうです 使えるように出来たら修正箇所を書きにまた来ます、ありがとうございました! http://mevius.5ch.net/test/read.cgi/tech/16636599
83/991
992: デフォルトの名無しさん (ワッチョイ 7b47-MMV6) [sage] 2024/10/29(火) 14:57:45.06 ID:HnPnA3Oe0 すまんけど参考に問題と結論をまとめてほしい http://mevius.5ch.net/test/read.cgi/tech/1663659983/992
993: デフォルトの名無しさん (ワッチョイ 497b-vCJ4) [sage] 2024/10/29(火) 20:54:54.00 ID:zqRlJI/00 次スレ 【PHP】下らねぇ質問はここに書き込みやがれ 15 https://mevius.5ch.net/test/read.cgi/tech/1730202739/ http://mevius.5ch.net/test/read.cgi/tech/1663659983/993
994: デフォルトの名無しさん (ワッチョイ 497b-vCJ4) [sage] 2024/10/29(火) 22:11:10.45 ID:zqRlJI/00 >>992 問題: PHPで (*SKIP) が使えない (>>947) 結論: 現在は使えないのが仕様 php8.3.12(最新安定版)ではphp_mbstringが対応していない oniguruma6.6.9(最新リリースバージョン)にも入ってない(開発したばかりで未リリース状態) なので通常は>>956,959で公式リリースを待つが、 パフォーマンスの問題、或いは(現在開発中のphpアプリの)リリース時には使えるようになっているという読み等で、 GitHub上のonigurumaソースを自前
でコンパイルして接続して使うのは自由 この場合の詳細は247が成功した後に報告してくれるから待てばいい 現在の作戦(981)の内容は以下(マクロは大文字で表記) onigurumaは設定を自由に変更出来る いくつかあるプリセットの内、ONIGURUMAを指定すれば(*SKIP)が使えるが、RUBYを指定しても使えない 現在のphpではデフォでRUBY指定であり、ONIGURUMA指定は出来ない --- (α) なので、oniguruma側のRUBY設定値をONIGURUMA設定値で上書きし、 php側でRUBY指定しててもONIGURUMA指定での機能が使えるようにする これだとonigurumaの再コンパイルだけで済む
はず(=php_mbstringは変更無く使える) この場合の問題は、ruby指定とoniguruma指定で完全な互換性がなかった場合に、(なお実際どうなのかは知らん) 他ソフト(laravel)等と組み合せると一部誤動作する可能性が出てくる事だが、 この場合はRUBYではなくEMACS等、 どう考えても誰も使ってないであろうマクロを潰せばいいだけなので、大した問題ではない (とはいえ商用用途ではこれも許されないだろうが) http://mevius.5ch.net/test/read.cgi/tech/1663659983/994
995: デフォルトの名無しさん (ワッチョイ 497b-vCJ4) [sage] 2024/10/29(火) 22:42:58.65 ID:zqRlJI/00 真面目に直すなら、αを修正してphp側からONIGURUMA指定出来るようにすればいい これは970に書いたとおり、 php_mbregex.c:489:static size_t _php_mb_regex_get_option_string php_mbregex.c:594:static bool _php_mb_regex_init_options の2関数を修正すればよく、下側は979に書いたとおり以下3行追加、上側はその逆を追加するだけ(多分) case 'o': *syntax = ONIG_SYNTAX_ONIGURUMA break; この辺やる気有るのならCのソースは俺が書いてもいいが
、報告その他は全部やってくれ 報告の仕方は https://www.php.net/get-involved の通り ただしバグ修正ではなく仕様追加なので、メンテナの判断により(ソースコードが妥当でも)却下される可 能性はある(改行は規制回避) >>994 すまぬ一部修正、規制に引っかかったついでに最後の段落書き足したら大文字にするのを忘れた × ruby指定とoniguruma指定で ○ RUBY指定とONIGURUMA指定で http://mevius.5ch.net/test/read.cgi/tech/1663659983/995
996: 947 (ワッチョイ 3374-D2cl) [sage] 2024/11/02(土) 11:20:08.91 ID:grhM95Vo0 どうやら正規表現の syntax を RUBY から ONIGURUMA に変えるだけではダメそうです この変更で (?W) が使えるようになったので syntax の切り替えは出来ているのですが、 正規表現に (*FAIL) や (*SKIP) を使うとエラーになります php_mbregex.c の 473行目のエラー処理が実行されます github.com/php/php-src/blob/2b10cd1bebde7b9844ebb6e3e60127dfe7b195c5/ext/mbstring/php_mbregex.c#L473 これを解決するには php_mbregex.c と onigurumaライブラリ を深く理解す
る必要があり、 このスレのみなさんにとっても簡単な問題ではないと思います そのため、ここは一度戦略的に撤退し、次の好機をうかがうことにしました 長々とお付き合い下さりありがとうございました! http://mevius.5ch.net/test/read.cgi/tech/1663659983/996
997: 947 (ワッチョイ 3374-D2cl) [sage] 2024/11/02(土) 12:21:06.68 ID:grhM95Vo0 詳細は以下のスレに書いておきました agree.5ch.net/test/read.cgi/mango/1715675838/323-325n C言語をいじるならデバックの仕方を知らないと話にならないようなので そういうことを覚えるのにかなりの時間がかかりそうです、なのでこの件は一旦保留にさせて下さい ( fprintf を仕込んで ./configure, make, make install ではラチがあかなくなったので) http://mevius.5ch.net/test/read.cgi/tech/1663659983/997
998: 947 (ワッチョイ 6274-erF6) [sage] 2024/11/03(日) 21:59:48.17 ID:kb0e81X60 補足: onig_init() は oniguruma の古いバージョンが使われたときに備えてのものでした なので問題ありませんでした 現時点では正規表現に (*FAIL) や (*SKIP) を使うとエラーになる問題は 「PHPのインストール時に (*FAIL) が実装される前の oniguruma が入れられていて それが使われているのではないか」という仮説を立てています (*FAIL) が実装される前の oniguruma が使われていたなら「 "FAIL" なんて名前知らない!」と 言われてもおかしくないので..
http://mevius.5ch.net/test/read.cgi/tech/1663659983/998
999: 947 (ワッチョイ 6274-erF6) [sage] 2024/11/04(月) 01:55:48.60 ID:nQYymDx80 ↑の仮説は否定されました oniguruma は最新Master branch版で間違いありませんでした oniguruma 6.9.9 で Fix されたバグが直っているのを確認しました また、古いバージョンの oniguruma が入っていないことを確認しました libonig-dev なども含めて他の oniguruma は1つも入っていませんでした http://mevius.5ch.net/test/read.cgi/tech/1663659983/999
1000: 947 (ワッチョイ 6274-erF6) [sage] 2024/11/05(火) 00:51:48.35 ID:QtAnl6270 oniguruma 付属のテストファイル /sample/callout.c では (*FAIL) や (*SKIP) が動くので、このテストファイルのコ-ドを php_mbregex.c に移植して動かしてみました (コンパイルエラーを回避するための最低限の変更のみしました) そしてPHPを動かしてみたところ、問題のエラーと同じエラーが出ました oniguruma 側でのエラーコード: -229 github.com/kkos/oniguruma/blob/f6723fd940b993b39b1535f71c8695867a5e92d1/src/oniguruma.h#L640 これにより、問題の原因がPHP
側にあることが確定しました しかし php_mbregex.c を読んでもこの問題を起こしそうな箇所は見当たりません 原因はコ-ドではなくPHPの環境にあるのかも知れま1000 http://mevius.5ch.net/test/read.cgi/tech/1663659983/1000
1001: 1001 [] ID:Thread このスレッドは1000を超えました。 新しいスレッドを立ててください。 life time: 776日 8時間 5分 26秒 http://mevius.5ch.net/test/read.cgi/tech/1663659983/1001
1002: 1002 [] ID:Thread 5ちゃんねるの運営はUPLIFT会員の皆さまに支えられています。 運営にご協力お願いいたします。 ─────────────────── 《UPLIFT会員の主な特典》 ★ 5ちゃんねる専用ブラウザからの広告除去 ★ 5ちゃんねるの過去ログを取得 ★ 書き込み規制の緩和 ─────────────────── 会員登録には個人情報は一切必要ありません。 4 USD/mon. から匿名でご購入いただけます。 ▼ UPLIFT会員登録はこちら ▼ https://uplift.5ch.net/ ▼ UPLIFTログインはこちら ▼ https://uplift.5ch.net/login
http://mevius.5ch.net/test/read.cgi/tech/1663659983/1002
メモ帳
(0/65535文字)
上
下
前
次
1-
新
書
関
写
板
覧
索
設
栞
歴
スレ情報
赤レス抽出
画像レス抽出
歴の未読スレ
AAサムネイル
Google検索
Wikipedia
ぬこの手
ぬこTOP
0.023s