Как зайти в Даркнет?!
25th January, 01:11
6
0
Как в tkinter из поля ввода Entry получить значение в одну переменную и обновить строку кнопкой, затем получить ещё одно введённое значение и затем сложить их. Ниже пример кода
21st July, 19:00
895
0
Программа, которая создает фейковые сервера в поиске игровых серверов CS 1.6 Steam
21st March, 17:43
948
0
Очень долго работает Update запрос Oracle
27th January, 09:58
914
0
не могу запустить сервер на tomcat HTTP Status 404 – Not Found
21st January, 18:02
905
0
Где можно найти фрилансера для выполнения поступающих задач, на постоянной основе?
2nd December, 09:48
938
0
Разработка мобильной кроссплатформенной военной игры
16th July, 17:57
1724
0
период по дням
25th October, 10:44
3955
0
Пишу скрипты для BAS только на запросах
16th September, 02:42
3720
0
Некорректный скрипт для закрытия блока
14th April, 18:33
4613
0
прокидывать exception в блоках try-catch JAVA
11th March, 21:11
4381
0
Помогите пожалуйста решить задачи
24th November, 23:53
6086
0
Не понимаю почему не открывается детальное описание продукта
11th November, 11:51
4351
0
Нужно решить задачу по программированию на массивы
27th October, 18:01
4396
0
Метода Крамера С++
23rd October, 11:55
4309
0
помогите решить задачу на C++
22nd October, 17:31
4002
0
Помогите решить задачу на python с codeforces
22nd October, 11:11
4492
0
Python с нуля: полное руководство для начинающих
18th June, 13:58
2599
0
фильтр" плохие слова"
Не очень технично, но ... .. Я должен внедрить фильтр плохих слов в новый сайт, который мы разрабатываем. Поэтому мне нужен список плохих слов "good", чтобы накормить мою БД... какой-нибудь намек / направление? Посмотрев вокруг с помощью google, я нашел вот это , и это начало, но не более того.
Да, я знаю, что такого рода фильтры легко избежать... но воля клиента - это воля клиента !!! :-)
Сайт должен будет отфильтровать как английские, так и итальянские слова, но для итальянского языка я могу попросить своих коллег помочь мне с построенным сообществом списком "parolacce": -) - an email подойдет.
Спасибо за любую помощь.
Остерегайтесь clbuttic ошибок .
- Apple совершила ужасную ошибку, вытеснив своего визионера - я имею в виду, посмотрите, что натворил NeXT!"
Хм. "clbuttic".
Google "clbuttic" - тысячи просмотров!
Есть кто-то, кто называет его машину 'clbuttic'.
Есть "Clbuttic Steam Engine" досок объявлений.
Словарь Вебстера - никакой помощи.
Хм. Что же это может быть?
HINT: люди, которые делают предположения о своих сценариях regex, будут а когда они повторяют эту ужасную ошибку, то впадают в отчаяние.
Я не видел никакого указанного языка, но вы можете использовать его для PHP, он будет генерировать RegEx для каждой инстерированной работы, так что даже преднамеренные ошибки написания (т. е. @ss, i3itch ) также будут пойманы.
<?php
/**
* @author unkwntech@unkwndesign.com
**/
if($_GET['act'] == 'do')
{
$pattern['a'] = '/[a]/'; $replace['a'] = '[a A @]';
$pattern['b'] = '/[b]/'; $replace['b'] = '[b B I3 l3 i3]';
$pattern['c'] = '/[c]/'; $replace['c'] = '(?:[c C (]|[k K])';
$pattern['d'] = '/[d]/'; $replace['d'] = '[d D]';
$pattern['e'] = '/[e]/'; $replace['e'] = '[e E 3]';
$pattern['f'] = '/[f]/'; $replace['f'] = '(?:[f F]|[ph pH Ph PH])';
$pattern['g'] = '/[g]/'; $replace['g'] = '[g G 6]';
$pattern['h'] = '/[h]/'; $replace['h'] = '[h H]';
$pattern['i'] = '/[i]/'; $replace['i'] = '[i I l ! 1]';
$pattern['j'] = '/[j]/'; $replace['j'] = '[j J]';
$pattern['k'] = '/[k]/'; $replace['k'] = '(?:[c C (]|[k K])';
$pattern['l'] = '/[l]/'; $replace['l'] = '[l L 1 ! i]';
$pattern['m'] = '/[m]/'; $replace['m'] = '[m M]';
$pattern['n'] = '/[n]/'; $replace['n'] = '[n N]';
$pattern['o'] = '/[o]/'; $replace['o'] = '[o O 0]';
$pattern['p'] = '/[p]/'; $replace['p'] = '[p P]';
$pattern['q'] = '/[q]/'; $replace['q'] = '[q Q 9]';
$pattern['r'] = '/[r]/'; $replace['r'] = '[r R]';
$pattern['s'] = '/[s]/'; $replace['s'] = '[s S $ 5]';
$pattern['t'] = '/[t]/'; $replace['t'] = '[t T 7]';
$pattern['u'] = '/[u]/'; $replace['u'] = '[u U v V]';
$pattern['v'] = '/[v]/'; $replace['v'] = '[v V u U]';
$pattern['w'] = '/[w]/'; $replace['w'] = '[w W vv VV]';
$pattern['x'] = '/[x]/'; $replace['x'] = '[x X]';
$pattern['y'] = '/[y]/'; $replace['y'] = '[y Y]';
$pattern['z'] = '/[z]/'; $replace['z'] = '[z Z 2]';
$word = str_split(strtolower($_POST['word']));
$i=0;
while($i < count($word))
{
if(!is_numeric($word[$i]))
{
if($word[$i] != ' ' || count($word[$i]) < '1')
{
$word[$i] = preg_replace($pattern[$word[$i]], $replace[$word[$i]], $word[$i]);
}
}
$i++;
}
//$word = "/" . implode('', $word) . "/";
echo implode('', $word);
}
if($_GET['act'] == 'list')
{
$link = mysql_connect('localhost', 'username', 'password', '1');
mysql_select_db('peoples');
$sql = "SELECT word FROM filters";
$result = mysql_query($sql, $link);
$i=0;
while($i < mysql_num_rows($result))
{
echo mysql_result($result, $i, 'word') . "<br />";
$i++;
}
echo '<hr>';
}
?>
<html>
<head>
<title>RegEx Generator</title>
</head>
<body>
<form action='badword.php?act=do' method='post'>
Word: <input type='text' name='word' /><br />
<input type='submit' value='Generate' />
</form>
<a href="badword.php?act=list">List Words</a>
</body>
</html>
Shutterstock имеет РЕПО Github со списком плохих слов , используемых для фильтрации.
Вы можете проверить это здесь: https://github.com/shutterstock/List-of-Dirty-Naughty-Obscene-and-Otherwise-Bad-Words
Я бы сказал, чтобы просто удалять сообщения, как только вы их узнаете, и блокировать пользователей, которые слишком откровенны со своими публикациями. Вы можете говорить очень оскорбительные вещи, не используя никаких ругательств. Если вы заблокируете слово осел (он же осел), то люди просто наберут a$$ или /\55, или что-то еще, что им нужно ввести, чтобы пройти фильтр.
Википедия ClueBot имеет фильтр плохих слов, прочитайте его источник.
http://en.wikipedia.org/wiki/User:ClueBot/Source#Score_list
Исследуя эту тему, я пришел к выводу, что требуется нечто большее, чем просто список, который делает произвольные замены. Я построил веб-сервис, который позволяет вам определить уровень 'cleanliness', который вы хотите. Он также прилагает усилия для выявления ложных срабатываний - то есть там, где слово может быть плохим в одном контексте, но не в других. Взгляните на http://filterlanguage.com