Нужен PHP скрипт для фильтрации нецензурной лексики.  
Автор Сообщение

4
Сообщение Нужен PHP скрипт для фильтрации нецензурной лексики.

После принятия в РФ определённого закона мат станет вне этого самого закона. Поэтому нужен фильтр, который будет этот мат вырезать. Желательно на PHP и с заполненой базой слов.

Идеи - типа есть масив слов и бегаем по нему и ищем такие слова в тексте не предлагать.

 

Тех. задание:

 

  • Разработать PHP скрипт, который заменяет нецензурные слова случайным набором сивмолов из определённого множества.
  • Исходный текст является HTML в UTF-8 кодировке.
  • Результатом должен быть тот же HTML в UTF-8 кодировке с заменённой нецензурной лексикой.
    пример:
    Код:
    <p>м</p>а<p>т</p>
    это должно фильтроваться без потери баланса тагов.
  • Скрипт должен быстро обрабатывать текст размером 250К.
  • Словарь нецензурной лексики должен быть расширяемым и содержать самые часто употребляемые слова.
  • Скрипт не должен заменять части цензурных слов, как пример:
    слова которые не должны распозноваться как мат: грёбля, грёбаный, глухую и т.д.


О цене вопроса договоримся.

 

П.С. Сложность работы примерна равна дипломной работе студента технического вуза.



28 апр 2014, 21:53
Профиль WWW

1
Сообщение Нужен PHP скрипт для фильтрации нецензурной лексики.

Надеюсь, Обители это не коснется.

btw 10 правил ведения IT бизнеса в России



28 апр 2014, 23:02
Профиль



<Г К Д>


Сервер: Свежеватель Душ
0
Сообщение Нужен PHP скрипт для фильтрации нецензурной лексики.

DDUHhttp://www.softtime.ru/info/matu_net.php http://www.phpground.ru/miscellaneous/anti-mate-php-class-l109.html

Старенькие, но работают исправно.



28 апр 2014, 23:08
Профиль Skype WWW

0
Сообщение Нужен PHP скрипт для фильтрации нецензурной лексики.

Failwood писал(а):

DDUHhttp://www.softtime.ru/info/matu_net.php http://www.phpground.ru/miscellaneous/anti-mate-php-class-l109.html

Старенькие, но работают исправно.

Видел, первый полный отстой, второй требует доработки.


Lelouch писал(а):

Надеюсь, Обители это не коснется.

btw 10 правил ведения IT бизнеса в России

Само собой.

П.С. домен в зоне ру и нужно соблюдать закон.



28 апр 2014, 23:16
Профиль WWW



<Г К Д>


Сервер: Свежеватель Душ
0
Сообщение Нужен PHP скрипт для фильтрации нецензурной лексики.

DDUH, 

http://cmska.biz/pro4ie/antimat-script.html - Посвежее. 2013 года.


http://sourceforge.net/projects/php-matotest/files/php-matotest/1.0/ php матотест



28 апр 2014, 23:23
Профиль Skype WWW

0
Сообщение Нужен PHP скрипт для фильтрации нецензурной лексики.

Failwood писал(а):

Не, это тот же самый скрипт. Просто перезалит заново, а версия кода та же и время модификации скрипта тоже самое.


Если ничего не найдём придётся писать самому.



28 апр 2014, 23:31
Профиль WWW



<Г К Д>


Сервер: Свежеватель Душ
0
Сообщение Нужен PHP скрипт для фильтрации нецензурной лексики.

DDUH, походу дела, это один фильтр, самый распространенный, написанный Дмитрием Перовым. 



28 апр 2014, 23:40
Профиль Skype WWW

0
Сообщение Нужен PHP скрипт для фильтрации нецензурной лексики.

Failwood писал(а):

DDUH, походу дела, это один фильтр, самый распространенный, написанный Дмитрием Перовым. 

Да, придётся его переписать и использовать.



28 апр 2014, 23:47
Профиль WWW



<Г К Д>


Сервер: Свежеватель Душ
0
Сообщение Нужен PHP скрипт для фильтрации нецензурной лексики.

Так, на всякий, мало ли что нибудь будет полезное. 

Клик



28 апр 2014, 23:55
Профиль Skype WWW

0
Сообщение Нужен PHP скрипт для фильтрации нецензурной лексики.

Вся сложность в том что текст идёт с HTML тагами, и просто так его на слова не разобьёшь. Нужно делать адаптацию, а потом ещё и замену.

Есть конечно вариант не давать постить мат и возвращать к редактору сообщения, но это не очень.



29 апр 2014, 00:23
Профиль WWW

0
Сообщение Нужен PHP скрипт для фильтрации нецензурной лексики.

DDUH писал(а):

Вся сложность в том что текст идёт с HTML тагами, и просто так его на слова не разобьёшь.

Есть куча стандартных библиотек, позваляющих парсить хтмл по тегам. По крайней мере на java.

Никакой сложности в даной операции не вижу.

Зы, сам пишу скрипт для парсинга соцсетей.



29 апр 2014, 04:03
Профиль

0
Сообщение Нужен PHP скрипт для фильтрации нецензурной лексики.

Т.е. обитель снова вернется в андеграунд,  если там будет мат разрешен?

 

 

З.Ы. А может можно просто сделать как в вове, танках, каждый желающий убирает птичку в настройках "скрыть нецензурщину" и закон соблюден и матерится можно и чувствительные господа удовлетворены?



29 апр 2014, 08:41
Профиль

0
Сообщение Нужен PHP скрипт для фильтрации нецензурной лексики.

Wuki писал(а):

Т.е. обитель снова вернется в андеграунд,  если там будет мат разрешен?

 

З.Ы. А может можно просто сделать как в вове, танках, каждый желающий убирает птичку в настройках "скрыть нецензурщину" и закон соблюден и матерится можно и чувствительные господа удовлетворены?

Ну сейчас я рассматриваю все возможные варианты. Если уж прижмёт, то придётся что-то делать с обителью.



29 апр 2014, 08:55
Профиль WWW
Начать новую тему Ответить на тему


Перейти:  

На сайте использованы материалы, принадлежащие Blizzard Entertainment. Копирование материалов возможно только c разрешения портала. В противном случае это будет называться уже другим словом.
Рейтинг@Mail.ru