「さくらのレンタルサーバ」の迷惑メールフィルターとして採用されている SpamAssassin ですが、まるで役に立ちません。
SpamAssassin はApacheソフトウェア財団のトップレベルプロジェクトの一つで、オープンソースなので広く使われているようです。
さくらインターネットでは、ウェブメール機能から迷惑メール判定を手動で行っていくうちに学習していく、はずなのです。
ところが、何度設定しても上手く学習してくれません。
そこで、さくらインターネットのサイトで情報を探していると、下記のページを見つけました。
「迷惑メールフィルタ」の判定はどのようにして行われるのですか?
ここに、迷惑メールと判定する基準が書いてあります。(便宜的に番号を振りました)
- HTMLメールである
- 送信元メールアドレスのアカウント部分に数字やアンダーバー(_)等の特殊記号が含まれている
- 表面上に送信元メールアドレスと実際のメールアドレスが違う
- 件名に「!」「?」等の記号が含まれている
- 本文中にURLが記述されている
3番は分かります。というか、当たり前です。
しかし、3番以外は、迷惑メールの基準としては考えが古いというか意味が無いです。
1番は企業からのメールマガジンや、普通の人でもHTMLメールを使っている人いますよね。
HTMLメールというだけで迷惑メールに判定されちゃ敵いません。
2番は全く根拠が分かりません。
だって、数字やアンダーバーを使っちゃいけないってルールはどこにあるんでしょう?
4番は企業からのメールマガジンでは使われるでしょう?
「新製品発売!」とか「予約開始!」とか「もう使ってますよね?」とか。
5番は本当に意味不明です。
URL書いてなかったら友達に面白いサイトを紹介することも出来ないですよね。
企業からのメールマガジンだと、URLが無いとメールマガジンの意味がありません。
つまり、SpamAssassinは現在の実情に合わない基準を持っているということです。
更に、どうやら日本語をキチンと解析していないようです。
高性能な迷惑メール対策ソリューションは世の中にあるんだから、個人的には有料でも良いから、選択肢として欲しいですね。
何でも無料なら良いってものではないんです。
選択肢はあった方が良いです。
というわけで、今日もShuriken2009の日本語スパムに強くて、海外のスパムにも強い迷惑メールフィルタ機能が役に立っているわけです。
仰る通り、全く学習していないようです。当方の場合、迷惑メールの6から7割程度が通常メールになってしまいます。さくらインターネットのメールボックスでは、これ以上どうにもならないのでしょうか。
kenchanさん
そうなんですよね~。現在のところが限界のようです。
いま、実験をしていて、
さくらインターネット→Gmailにコピーを転送→Shuriken2009でGmailをIMAP4で受信
というのをやってます。
現在の所、さくらインターネットのメールボックスを直接取得するのよりも、Gmailに転送して受信したほうが圧倒的に迷惑メールを判定してくれました。
ほとんどのスパムは迷惑メールフォルダに入っていて、受信ボックスが綺麗です。
ですが、誤判定もちょっとだけありますね~。
誤判定されたもの「迷惑メールを解除」して、Shurikenで同期し直すと、Shurikenの迷惑メールフォルダには移動せずに受信ボックスに残りました。
Gmailもまだまだですね。
ネットから良い方法が見つかりました。
さくらの迷惑メールの判定は、spamassassinですが、この判定ソフトの判定値を変えることで、画期的に精度が上がることが、実証できました。
入った迷惑メールをspamと学習させ、丸1日で画期的に良くなりました。
さくらのメールでは(メールソースから)、
X-Spam-Status: No, score=-2.6 required=7.0 tests=BAYES_00 autolearn=ham
version=3.2.5
*score=-2.6:そのメールの判定値 ← 各メールで変化する
*required=7.0 判定値7.0を超えるとspamと判定される
scoreが高いほど、迷惑となります。
この判定値required=7.0の数値を変える方法が分かりました。一般的には標準がは5.2だそうで、今回は、2.4にして良くなったとのネット情報でしたので、私も同じにしました。
その方法は
1.以下のファイルを作成(メモ帳で可)
ファイル名:user_prefs (拡張子なし)
2.内容
required_score 2.4
3.サーバーにFTPでアップ
場所:各人のフォルダの
/home/各自違う/.spamassassin のフォルダ(wwwの1つ上)
さくらでこれを行って良いかは確認していませんが、問題なく出来たので、良しとしましたが、状況の変化で先々は分かりませんが。
おおお。情報ありがとうございます!
早速、設定してみました。
明日、確かめてみますね。^o^
画期的と書きましたが、まだかなりすり抜けます。
(一時的に2時間位の間では、良かったのですが)
昨夜、required_score 2.4 を 2.0 にし、今朝の結果で受信120通あり、
受信トレイ:36通(迷惑以外は、1通)
迷惑メール:84通
36通中、迷惑は35通でした。いずれも、送信者・件名とも日本語以外です。
84通中は、全て迷惑でした。
120通中、35通がすり抜けていますので、迷惑判定率7割です。せめて、9割以上はいきたいですね。
今日は、2.0 を少し上げてみます。
ただ、学習効果がどの程度発揮されるか、全く不明でなので、焦らずやるいかないのかも、しれませんね。
なるほど~。
って、120通中、119通が迷惑メールってことですか?
激しいですね・・・。
私の場合、1日しか経ってませんが、昨日、40通くらいすり抜けていた迷惑メールが6通になっていました。
すごい!
ウェブメールで確認しましたが、誤判定も無いようです。
私は迷惑メールの判定率も上げて欲しいですが、一方で、誤判定は限りなくゼロにして欲しいと考えています。
迷惑メールは確かに迷惑ですが、余り強くやり過ぎて誤判定し、そのせいで読みたいメールが読めないことが悲しいからです。
6通しかすり抜けてこなかったというのは、私としては大満足ですよ~。
本当に、役立つ情報を教えて頂いてありがとうございました。
何事も設定次第ですね~。
少しはお役に立てて良かったです。仰るように、受信したいメールが迷惑メールとなって、読み損なうと非常にまずいですね。
以前から、メールアドレスはそろそろ替え時と思っていましたが、愛着もあり、連絡先が多いため、躊躇していまして、このさくらのフィルターに期待いていますが、当方はあまり芳しくありません。迷惑の大半が英文ですが、これらがすり抜けてしまいます。
昨夜の約8時間での受信110通中、全てが迷惑でしたが、迷惑をすり抜けたメールは27通(全て英文)。Score1.5の結果です。
spamassassinhaは、英文の判定がかなり甘い感じです。
現在、メールソフトはThunderBBirdを使用していますが、これに入る前に一旦さくらで出来るだけ迷惑メールを減らそうと思ったのですが・・・・。ただそこそこの成果はあったと思います。
いずれにしても、メルアドは変えることにします。
いえいえ、とんでもないです。
とても助かりました。
迷惑メールとしての学習の効果ですが、私の場合、2ヶ月くらい前に、ウェブメール画面で、迷惑メールとして学習させるのをしていた効果が出ているのかもしれません。
で、ウェブメールの画面って分かりづらいのですが、どうやら、下記の様にすれば学習してくれるようです。
◆「受信箱」の一覧画面で明らかに迷惑メールと分かっているメールを学習させる方法
(1)迷惑メールのチェックボックスにチェックを入れる
(2)「チェックしたメールを」の左側のチェックボックスにチェックが入っていることを確認)(デフォルトで入っています)
(3)「チェックしたメールを」の右側のプルダウンメニューから「SPAMとして学習する」を選択する
(4)更に右側のプルダウンメニューがありますが、ここでは「空白」のままにしておく(これがポイントのようです)
(5)「実行」ボタンをクリック
私が最初、上記の(4)のところで「迷惑メール」にもしていたのですが、どうやら、これを選択すると学習しないようです。
何ヶ月も同じ作業をしてても、効果が無いなぁと思ってました。
2ヶ月前に、ふと、もしかして何か間違ってるんじゃないか?と思って、上記のようにやってみたんです。
ただ、FAQにも載ってなくて、私の経験上のものなので、あくまで参考にされて下さい。
でも、これによって、英文の迷惑メールはかなり減りました。
そこにkenchanさんから教えて頂いた方法を加えたところ、激減した、というワケです。
メールアドレスを変更される前に、お試しになってみて下さい。
> とても助かりました。
ありがとうございます。お役に立てて良かったです。
お添えさんの言われることは、初めて知りました。
> (4)更に右側のプルダウンメニューがありますが、ここでは「空白」のままにしておく(これがポイントのようです)
この部分の意味が分からず、迷惑メールを選んだり、「空白」のまま「実行」したりしていました。今日から早速はじめてみたいと思います。
ありがとうございました。
尚、昨夜(23時-07時)は画期的に良くなっていました。
129通中全てが迷惑でしたが、スリ抜けが7通でしたので、判定率95%という状況です。何だか、よく分からなくなってしまいました。(現在、score=1.5 のままです)