はてなキーワード: 全文検索とは
これ半分犯罪だろ
・唐澤貴洋の新口座が発掘される
・唐澤を名乗り「あなたのメールアドレスが流出情報に含まれていました、うちの口座に3万振り込めばダークウェブからの削除を行います」という趣旨のメール文を準備
・上記文が出来た直後にちょうど脆弱な企業メーラーを1つ乗っ取りに成功、角川が漏らしたメアドを一気にインポートさせて順次送信中(Xで23時半頃から続々と着信報告)
・データを暫定的にダウンロードし終わり、23時過ぎにTorrentやGithubに流した模様
・嫌儲に貼られた夏野一家などの個人情報がいっぱい書かれたレスのコピペ元は恒心教の掲示板
・経営者一家宅に送るピザにパイナップルをトッピングするかで大激論
「自分のメアド過去のものも全部含めて流出してないか確かめたいから、バラ撒かれたファイル落として確かめる。全文検索かけるのめんどいなあ… せや!ハッキングした企業メーラーに適当な尊師名義のメール一斉送信させて、自分の端末にヒットするか見るわ!」
Google 検索は、検索漏れがしばしば発生したので、検索漏れに対しては、「登録しますから、その URL を報告してください」というページが用意されていた。しかし今は、そのページがなくなって、検索漏れの報告の受付をしなくなった。
かわりに、サイトの持主ならば、あらかじめサイトを登録しておくことで、検索漏れを報告する特別なページが使える。ただし、あらかじめサイトを登録しておくことが必要なので、手軽に報告することはできない。
また、いちいち(数分間をかけて)検索漏れを検証する必要があるので、多くのページを次々と報告することもできない。
結果的に、検索漏れのページがたくさん発生したまま、報告を受け付けないので、検索漏れのページがたくさん残っている。検索漏れのページは、昔はほとんどなかったのに、今ではたくさん発生するようになった。そのせいで、ブログを書いたあとで、サイト内検索をしても、Google では検索漏れが多大に発生するようになった。仕方がないので、ブログ機能で全文検索するしかない。これだと、サーバーの機能が弱いので、瞬時に結果が出ることはなく、かなり待たされるが、検索漏れがないので、Google よりは信頼できる。しかし、遅いんだよね。
厚生労働省は通知関係をデータベースで全文検索できるようにしていて国の役所の中では比較的ましな方なんだけど、
こんなふうに重要通知をスキャンデータを掲載してるだけのケースも山ほどあるんよ。なんとかしてくれよ
https://www.mhlw.go.jp/web/t_doc?dataId=00tc1901&dataType=1&pageNo=1
一応市町村向けの専用ポータルみたいのはあってpdfで取得出来たりはするけど、改正の新旧対照表だけのっけて
改正を反映した溶け込み後の通知や条文がついてないとかザラなんよ。頼むよ。
おまえのパソコンの一太郎ファイルをそのまま載せればええんよ。
あと保育関係な。通知の名称で検索するとGoogleさんがpdfファイルへの直リンを示してくれるけど、
最近は以前ほど流行らなくなった感もあるが、こういったツールを用いて全てを一箇所に記録、蓄積して知的生産に役立てようというのは自分の中でも大きなテーマになっている。
メモツールの類にドキュメントを片っ端から放り込んで全文検索するのが基本的な使い方だ。
近頃はペンダント等のウェアラブルデバイスで常時録音録画して、音声や画像から文字起こしでテキストを抽出し記録して検索の対象とするサービスが出てきた。
極端な話、もし出生した時からこうしたデバイスを常時着用し、見聞きしたあらゆる事をデータ化できれば、その人生のすべてが検索可能になるだろう。
今後、脳と機械がBMIで接続できるようになれば、脳内の記憶あるいは思考すら外部にデータとして蓄積可能になるかも知れない。
そうなれば、ある意味、自分の分身がデジタルの世界に創り出されるとも言える。生きているうちに自分をデジタル化するのが今の願望だ。
デジタル化したせいで余計な作業が増えているという記事を読んだ。
https://blog.tinect.jp/?p=86085
自分は80年代生まれのオッサンで記事の著者よりも年配なのだが、これっぽっちも共感できなかった。と言うのも社会のデジタル化が進んだ時代でなければ、まともな生活を送れていなかったであろうと断言出来るくらいデジタル技術に助けられているからだ。
子供の頃より発達障害の気があったのか、とにかく紙を使った事務作業的なことができなかった。手書きの文字が汚すぎて第三者が読めない、学校で配布されるプリント類はまともに整理できないわ、授業の板書はただの走り書きになって見返しても意味不明になるわと、とにかく書類が扱えなかった。手帳を買ってもまともに記録できなくて予定管理もダメダメだった。
そんなわけで、高校までの授業態度を加味した学校の成績は壊滅的だったが、勉強自体はそこそこできたので大学進学はできた。大学生になると授業のレポート作成にPCを使えるようになって生活が一変した。壊滅的だと思っていた事務能力が、PCのおかげで飛躍的に向上したのだ。
まず、まともに資料が作れるようになった。手書きのノートと違って、誰でも美しい文字がかけて何度でも修正が効く。メモ帳でテキスト形式の文章を作っておけば、後から内容を検索して見返すことができる。PCのおかげで高校生まで苦手意識のあった資料作成が得意分野に変わったのだ。
次にデータ管理。PCの検索機能やソート機能には本当に助けられた。ファイル整理を一切しなくても、全文検索や拡張子別に並べて日付ソートすれば目当ての資料が見つかるというのは最高すぎた。紙だとそうはいかないので大変だった。
↓
数ヶ月後に別の書類が必要になった時、前回の捜索でひっくり返したせいで資料がぐちゃぐちゃになって見つからずさらにひっくり返して探しまくる
↓
その次、別の書類が必要となった時にはさらに棚が混沌としておりもはや発見困難…
というような悪循環を繰り返していたので、デジタル化によってようやくまともに資料管理ができるようになったのだ。
就職活動のときもデジタル化に助けられた。そもそも手帳が使えない人だったので、PCからでも携帯からでも入力できるGoogleカレンダーがなければスケジュール管理が不可能だった。履歴書だって、手書きで作ると字が汚すぎて門前払い喰らっていたかもしれない。
学生の時点でこうなので、就職してからはなおさらである。紙ベースで仕事する職場だったら、入社直後に社会不適合者のレッテルを貼られてしまい、干されてパワハラ受けて鬱で退職していたかもしれない。今の職場で15年以上働き続けて、いつしか管理職になり、今では部下を持ってそこそこ仕事が出来ているのはデジタル化のおかげとしか言いようがない。
仮に自分が昭和や平成初期に社外人になっていたかと思うとゾッとするので、デジタル化が進んだ時代に生きることができて本当に良かったと思っている。そんなわけで、この手の社会のデジタル化の議論をする時は、効率の面だけでなくて発達障害の気のある人の救済になっているという側面についても、もう少し注目されても良いのではないかと思う。
方言禁止が話題になって増田もぜんぜん歴史のこと知らなかったんだけどさ、一瞥して企画の意図はわかった、というか、正解かわからないけど増田の脳内の経験においてそういうことだろうってイメージはわいたよね。
いわゆる英語/カタカナ禁止ゲームみたいなやつの一種だなこれ。って。逆ルー語っつーのかな。
そういう普段の出力に一回変換をかませて言いよどんだりウッカリ変換できなかったりを笑う、人間性を笑うというと言葉が悪いけど、人間ならではの労働の苦しみと創造性を楽しむ笑い。
増田は関西人だけど関西弁禁止で話してっていわれても不快感はないしぼろぼろ失敗して笑われて自分でも笑うだろうなって思う。
だからなんだ、こんなもんに沖縄だけ特別視すんなよとか(他地方版では好評らしいし?)、実際今を生きる沖縄人の若者がこの企画の文脈を独自に読み取ってどれだけ憤るかってのはすごーく疑問に思ったりする。
まあこんな雑な感想はどうでもいいんだが。
それでまあこういう企画ってやっぱ面白いよねって。何が面白いってさっきも書いたけどユニークな表現もあるけどメインはやっぱり人の焦りとか苦悩とか失敗な部分なわけじゃないですか。それを起こすってのは一言で言って「脳に負荷をかける」。
じゃあほかにどんな脳に負荷かけての回答を楽しむ方法があるのかなーって気になるのよね。
第一は今回問題になった方言やルー語といった変換系。変換対象を見つける能力と適切に変換する能力が必要で、脳に全文検索を強いるから難しいと思う。
次はー、時間制限?王道の王道だよね。タイムリミットギリギリでの焦りから珍回答を連発する姿が滑稽で面白い。タイムショック(古すぎだ)とかネプリーグとか。
ネプリーグのタイムボンバーは時間制限もだけど、チーム戦で後半になるほど有効回答が減っていくという使えるものが減っていく点もちょっとだけ似たような構図になるのかな?幽遊白書の使える言葉が減っていくゲームとかもこれで考えて喋らないといけない。
脳を働かせないとでいうと酸欠系はあるだろうか?激しい運動を伴うやつ。フレンドパーク(これも通じないだろうな)のルームランナーで走りながら答えるやつって走る人と答える人別々だったっけ?忘れたけど走りながら答えるなら大変だよね。ほかに具体例は思いつかないけど若手芸人が早いもの勝ちのビーチフラッグみたいに回答権を競うやつはありそう。はあはあ言いながら瞬発力で答えるのは大変で笑いになるはず。
もっとシンプルに「脳を働かせない」なら簡単だ。飲酒。これに勝るものなし。芸能人はぁ、あんまりしなかったりする?ドッキリ・隠し撮り系とか?あまり見ないからわからないけど、テレビで飲酒した素人との会話が笑いになってるといえば月曜から夜更かしだろうか。かなりメイン企画になってたと思う。ネットではもう「飲酒実況」とか古くからの笑えるコンテンツだね。
あー酸欠系に似た感じだと欲求・疲労系みたいなものもありそう。たとえばまたネットで言うと「耐久配信」みたいな長時間やったり眠らなかったり。これは増田は見たこと無いんだけど。後半は面白いのだろうか?テレビだと帰れま10?食欲を満たす方向と長時間拘束の疲労がウケてたのだろうか。ガキつかの24時間の寝る前や終了前はかなりぐだぐだになるよね。いや書いてて思うけど喋りは面白くないなこれ。疲労系は単純に出てくる量も質も悪くなってその状態を左団扇で見て楽しむもうちょっとハイコンテクストな笑いだわ。
こんなもんかな?増田、あまりバラエティは見るほうじゃないから思ったほどでなかったわ。あとはー…危険球でいうと、どんな話題でも「与党がー」みたいにこじつけてくる人は脳死で書いてる~みたいに言われてこれも「脳が働いてない笑い」になるのだろうか?おおあぶないあぶない。
TSや男女入れ代わりは女性文化を模倣しきれない男性を楽しむコンテンツ?スカートで股開いたり?いやーやりすぎると無能・低能力を嗤うに繋がりそうでダメだね。あくまで一時的にってのが大事だと思う。
このまとめを読んで、確かにこのままいくのはマズいと感じたので、思ってることを一応自分もまとめておきたい。
イーロン・マスクがXを「出会い系アプリにする」とか言い出したけどXをやめたい→でも、こんな理由があるのでXをやめるのは簡単ではない
さもなければ日本人と日本企業は X(Twitter) を利用することが事実上できなくなる。
面識のない異性と交際したい人=「異性交際希望者」といい、交際したい書き込み=「誘引情報」という。
という「出会い系サイトの4要件」というのがあり、これに当てはまると出会い系サイトということになる。
→ これにより X(Twitter) は、日本法でもマジで出会い系サイトに該当することになりそうだが
→ 現行の法制では恐らくならない。
→ なぜなら X(Twitter) は異性交際だけでなく同性交際もできる仕組みなので、出会い系サイトではないと言い張れるのである。
まとめると、 X(Twitter) は本来、ギリギリで出会い系サイト扱いされずに済んでたサービスなのだが、「出会い系サイトにする」と明言されてしまうと、それは出会い系サイトになる可能性が高まるのである。
- (問)あるサイトが、開設者が知らないうちに実質的に出会い系サイトとして利用されていた場合、そのサイトは「インターネット異性紹介事業」に該当するのか。
- (答)自らが運営するサイトが知らないうちに、実質的にインターネット異性紹介事業に利用されていた場合、サイト開設者はサイトの運営方針として「異性交際希望者」を対象としてサービスを提供していないことから、基本的には「インターネット異性紹介事業」には該当しませんが、異性交際を求める書き込みを知りながら放置するなどサイト開設者がその利用実態を許容していると認められるときは、「インターネット異性紹介事業」に該当する場合があります。
「インターネット異性紹介事業」の定義に関するガイドライン
出会い系サイト規制法(インターネット異性紹介事業を利用して児童を誘引する行為の規制等に関する法律)の規制がある。
つまり 18 歳未満がサービスに絡むことを徹底的に排除し監視する義務を負うのである。
守らないと違法。
JC/JK が X(Twitter) 上で「私 JC だけど新宿でこれから即ホ苺」みたいな書き込みを放置した瞬間にアウトになり、警察はサービス中止命令ができる。
インターネット異性紹介事業を利用して児童を誘引する行為の規制等に関する法律等の解釈基準
https://www.npa.go.jp/laws/notification/seian/shounen/shounen230705.pdf
インターネット異性紹介事業者の閲覧防止措置義務(いわゆる削除義務)に関するガイドライン
もちろん「成人指定」とか「18禁」とかと同じアダルトサイトという括りになるため、教育現場で X(Twitter) を使用することが出来なくなるであろう。コンプラを意識する法人も 18 禁サイトは非常に使いにくくなる。出会い系サイトを名乗るということは、そういうことなのである。
これを乗り越えた人しか X(Twitter) を利用することができなくなってしまう。この時点で相当数の離脱者が出てくる可能性が大。
ほんとにそう。昨今の未成年淫行なんてほとんど X(Twitter) やインスタの DM がキッカケになってると思う。警察も X(Twitter) のタイムラインを熱心にパトロールするようになったが、防ぎきれていない。なので SNS は警察が今までやってきた青少年保護育成に対する障壁になっているのである。
実は出会い系サイトで「未成年淫行」が問題になることはほぼ無い。出会い系サイト運営側はかなりしつこく未成年を排除している。そのためなら全文検索するし AI も活用するし目視でも確認する。ところが X(Twitter) にはそれがない。「未成年が守られていないサービスはむしろ SNS のほう」であることを認識すべきである。