Меню

Как установить фильтр на сервер

Бесплатный контент-фильтр для Linux и Windows

В этой статье мы рассмотрим мультиплатформенное (Linux, Windows) решение для эффективной контент-фильтрации, его установку и настройку. Такой фильтр можно использовать в школах или других образовательных учреждениях.

Введение

Сначала немного теории, если кому неинтересно, можно перейти к следующей главе. Какая фильтрация бывает? Фильтрация трафика может быть двух видов, серверная и клиентская.

Принцип работы серверной фильтрации

Есть выделенной компьютер, на нём настроен интернет, и этот интернет раздаётся на остальные компьютеры через локальную сеть. Фильтрация происходит на выделенном компьютере. Известные программы для организации серверной контент-фильтрации:

Для windows:

Но есть один большой недостаток для решений под ОС Windows, все они, почти, платные, а если и бесплатные, как МКФ, то требуют установки платного продукта.

Для Linux:

Данные программы бесплатны. Но они более сложные в настройке.

Принцип работы клиентской фильтрации

На каждом компьютере, где нужна контент-фильтрация, устанавливается и настраивается программа, которая это делает. Примеры:

Windows
Linux

Теория

А теперь поговорим о достаточно простом бесплатном способе контент-фильтрации, но и при этом достаточно эффективном. За всё время я испробовал много способов контент-фильтрации, но этот зарекомендовал себя как один из лучших и простых решений. Его так же можно использовать вместе с любым из других способов как дополнение.

Что нам для этого надо
Как это работает?

У браузера Mozilla Firefox, есть множество дополнений. На основе таких дополнений мы будем делать контент-фильтрацию.

Описание дополнений
Первое дополнение в нашем списке это WOT

WOT (Web of Trust) — это бесплатная надстройка к браузеру, которая предупреждает Интернет-пользователя во время поиска информации или совершения покупок о потенциально небезопасных веб-страницах. WOT совместим с такими браузерами как Internet Explorer, Mozilla Firefox, Opera (в 11 версии при помощи расширения) Google Chrome. википедия

В этом плагине есть и родительский контроль. С помощью этого плагина мы будем выполнять контент- фильтрацию.

Второе дополнение. Adblock Plus

Adblock Plus — расширение для браузеров и другого ПО на основе Gecko: Mozilla Firefox (включая «мобильный»), Mozilla Thunderbird, Mozilla Suite, SeaMonkey, Songbird и Mozilla Prism, позволяющее блокировать загрузку и показ различных элементов страницы: чрезмерно назойливых или неприятных рекламных баннеров, всплывающих окон и других объектов, мешающих использованию сайта. википедия

Этим плагином мы вырежем всю рекламу и баннеры.

Третье дополнение. Public Fox

Он нужен для того, чтобы дети не смогли отключить дополнения, отвечающие за контент-фильтрацию. С помощью него мы поставим пароль для настроек.

Практика

Итак, приступим. Настройка под разные ОС почти не отличается. В Linux я использую браузер iceweasel.

Приступим, установим дополнение WOT
Устанавливаем дополнение Adblock

Здесь я не буду приводить повторяющиеся картинки. Если что вызывает трудности, можете смотреть выше, это делается по подобию.

Всё расширение Public Fox настроено. Нажимаем Кнопку «ОК».

Убираем пункт «WOT» из инструментов

Эта часть более сложная, но в ней мы исключаем любую возможность отключить расширение, отвечающие за фильтрацию. А это пункт меню в инструментах.

В Windows
В linux

Если Вы сами хорошо знакомы с лунуксом, то можете сделать проще. Нам нужно зайти /home/user/.mozilla/firefox/3ji8e26a.default/chrome (3ji8e26a.default — профиль, у Вас он называется по другому) и там изменить файл, как и какой смотреть ниже.

Читайте также:  Positive grid bias amp как установить

Чтобы способ был более универсальным для разных версий линукса, будем делать всё через консоль (терминал).

И проверяем наличие пункта меню «WOT» если его нет, то мы всё сделали правильно. В настройки WOT можно зайти через дополнения, которые защищены паролем.

В результате у меня:

Далее переходим в настройки firefox. Он должен запросить пароль, введём пароль.
Зададим домашнюю страницу http://family.yandex.ru

По идее, войну с поисковиками можно продолжить, т.е. оставлять для поиска только безопасный гугл поиска или семейный поиск яндекса. Но это уже выходит за рамки этой статьи.

Напомню, что необязательно это всё проделывать на каждом компьютере. Достаточно скопировать профиль
мозилы (написано выше где находится профиль). И заменять этот профиль на другом копьютере.
Все настройки и плагины перенесутся на другой компьютер.

Чтобы наш фильтр был эффективным, нужно запретить использование других браузеров, в ОС Linux это решается легко, если браузер не один, удаляем остальные. В ОС Windows это уже сложнее. Нужно сделать тоже самое, удалить
установленные браузеры.

Остаётся только internet explorer (далее ie) браузер по умолчанию, который удалять нежелательно. Поэтому делаем FireFox браузером по умолчанию. И удаляем все упоминания о ie из пуска и рабочего стола, ярлыки быстрого запуска. Это практически достаточно. Запретить запуск ie возможно стандартными средствами ОС.

Зачем нужен безопасный и семейный поиск?

Что может быть лучше контентной фильтрации предоставляемой такими большими
компаниями как яндекс и гугл? Которые своими алгоритмами отфильтровывают нежелательный контент. Нам лишь остаётся воспользоваться этим.

Многим пользователям важно иметь возможность оградить себя и своих детей от сайтов с материалами «для взрослых» при поиске в интернете. Поэтому с 1999 года на Яндексе существует «семейный поиск», где мы стараемся максимально обезопасить пользователей от появления в результатах поиска сайтов с «взрослым» содержанием как по запросам с неоднозначным толкованием, так и по прямым запросам. http://webmaster.ya.ru/replies.xml?item_no=7913

Многие пользователи предпочитают, чтобы в результатах поиска не появлялось содержание только для взрослых (особенно если этот компьютер используют дети). Фильтры Безопасного поиска Google позволяют настроить браузер таким образом, чтобы подобное содержание в результатах поиска не отображалось. Google использует автоматизированные методы определения неприемлемого содержания и постоянно их совершенствует, учитывая отклики пользователей. Чтобы выявить содержание сексуального характера, мы обычно используем алгоритмы проверки сразу по нескольким параметрам: ключевые слова, ссылки, изображения и т. д. И хотя не существует фильтров, которые бы работали без погрешностей, использование Безопасного поиска в большинстве случаев избавит вас от содержания подобного рода. http://www.google.ru/support/websearch/bin/answer.py?answer=510

Подведём итоги. Что мы имеем?

Данная статья не подлежит комментированию, поскольку её автор ещё не является полноправным участником сообщества. Вы сможете связаться с автором только после того, как он получит приглашение от кого-либо из участников сообщества. До этого момента его username будет скрыт псевдонимом.

Источник

Записки IT специалиста

Технический блог специалистов ООО»Интерфейс»

Читайте также:  Как установить программу вацап на планшет

DansGuardian. Настраиваем контент-фильтр роутера

В определенный момент перед каждым системным администратором встает вопрос фильтрации интернет контента. Особенно актуально этот вопрос стоит в учебных заведениях. Фильтрации по URL и IP в данном случае недостаточно, при таком подходе администратор будет «вечным догоняющим», блокируя нежелательный контент уже после его посещения пользователем. Поэтому наиболее эффективным решением будет установка контент-фильтра.

Контент-фильтр позволяет эффективно блокировать нежелательный контент на основе анализа содержимого веб страниц. Достоинством этого метода является высокая определения нежелательного контента на любых сайтах, возможность блокировать отдельный материал, не блокируя доступ к сайту в целом. Недостатки тоже довольно существенны. Это повышенная нагрузка на сервер, что в случае большого количества активных клиентов может потребовать значительного увеличения вычислительных возможностей сервера. Вторым недостатком можно назвать возможность ложных срабатываний контент фильтра. Так, например, могут быть заблокированы сайты медицинской тематики из-за того, что на странице встретится слово «секс». Этот фактор делает иногда довольно затруднительным составление правил для фильтрации.

На наш взгляд контент-фильтр можно рекомендовать к применению там, где необходимость надежно блокировать нежелательный контент имеет больший приоритет, чем возможная недоступность нужной информации. В первую очередь это учебные заведения, где задача фильтрации контента стоит весьма остро. Для коммерческих структур на первый план выходит требование к доступности информации, поэтому контент-фильтр будет для них не самым лучшим решением. В этом случае более приемлем способ разграничения доступа по URL и IP.

Одним из лучших решений для платформы Linux, и одним из лучших контент-фильтров вообще, является DansGuardian. Он бесплатен для некоммерческого применения, цена лицензий тоже невысока. Для установки контент-фильтра необходим настроенный роутер с прокси-сервером Squid. Мы использовали сервер, настройку которого описали в статье: Linux. Настройка роутера (NAT + DHCP + Squid), все дальнейшие рекомендации мы будем давать применительно к его настройкам и конфигурации.

Для установки DansGuardian выполним в терминале следующую команду:

Внимание! В Ubuntu Server 12.04 и 14.04 при установке Dansguardian может возникнуть ошибка: Внимание: указанный домашний каталог /var/log/dansguardian уже существует, которую следует проигнорировать.

Теперь откроем конфигурационный файл программы /etc/dansguardian/dansguardian.conf, первое что вы должны сделать, это закомментировать или удалить строку:

Следующий параметр reportinglevel задает уровень фильтрации, он может принимать значения:

По умолчанию уже установлено значение:

Этот режим наиболее подходит для повседневного применения. Для тестирования правил удобно выставлять уровень фильтрации 1 или 2 (это потребует настройки на машине web-сервера). Следующий интересующий нас параметр, это язык HTML шаблона страницы запрета:

Теперь раскомментируем строку указывающую путь к файлу лога:

Укажем сетевой интерфейс и порт на котором DansGuardian будет принимать соединения от клиентов:

Остальные параметры менять не нужно. DansGuardian будет работать на порте 8081, в свою очередь Squid должен использовать порт 3128. В конфигурационном файле Squid /etc/squid/squid.confнаходим следующую строку:

Внимание! В Squid3 вместо опции transparent используется intercept

Если вы собираетесь использовать уровни фильтрации 1 и 2 укажите путь к скрипту вывода страницы запрета:

Для проверки настроим браузер клиентского компьютера на использование прокси-сервера 10.0.0.1:8081

Попробуем посетить сайты с сомнительным контентом. Мы решили набрать в Яндексе поисковый запрос «терроризм» и походить по ссылкам. Фильтр пропустил статью на Википедии, но в то-же время заблокировал статью на стороннем сайте вполне корректного содержания, сыграло роль слишком частое употребление слова «терроризм» в тексте страницы.

Читайте также:  Как установить переадресацию смс с одного номера на другой

Четко блокируется доступ к «веселым картинкам», даже по вполне невинным запросам, были заблокированы отдельные страницы форума на которых встречался нежелательный контент. Убедившись в работоспособности контент-фильтра перенастроим наш роутер так, чтобы весь HTTP трафик по умолчанию заворачивался на DansGuardian. Для этого открываем /etc/nat и следующим образом изменяем в нем последнюю строку:

Убираем прокси из настроек браузера и проверяем еще раз. Все должно работать.

Теперь самое время перейти к тонкой настройке фильтрации. Как показали наши испытания, DansGuardian «из коробки» неплохо справляется с большей частью нежелательного контента, но есть и исключения. Существуют тематики где фильтр оказался практически неработоспособным. Например, нецензурная брань, мы без труда посетили «официальный сайт символического направления» и несколько аналогичных ресурсов, также без особого труда нашли инструкцию по изготовлению бомбы и рекомендации по выращиванию конопли. Понятно, что это настраивается, чем мы сейчас и займемся.

Все фильтры DansGuardian представляют собой простые текстовые файлы и расположены в /etc/dansguardian/lists, однако каждый раз править их через консоль сервера не очень удобно, гораздо удобнее было бы работать через web-интерфейс. И такая возможность есть, для этого потребуется установить Webmin, утилиту удаленного администрирования сервера, имеющую весьма широкие возможности. В репозиториях Ubuntu Webmin отсутствует, но его можно установить загрузив deb-пакет с сайта разработчиков, либо подключив их репозиторий. Второй путь кажется нам более оптимальным. Добавим в /etc/apt/sources.list строку:

Теперь установим GPG ключ, которым подписаны пакеты в репозитории Webmin, выполним следующие команды:

Теперь обновим список пакетов и приступим к установке:

Доступ через Webmin можно получить с любого ПК набрав в браузере следующий адрес: https://10.0.0.1:10000/

Для управления DansGuardian нам нужен соответствующий модуль для Webmin, скачать его можно с сайта разработчиков, на момент написания статьи актуальной была версия 0.7.0beta1. Установим его через закладку Модули Webmin, теперь он будет доступен в разделе Службы.

В первую очередь правильно сконфигурируем модуль, настройки доступны по ссылке Настройка модуля слева вверху. Нам потребуется изменить настройку Full path to DG binary на /usr/sbin/dansguardian.

Из всего многообразия настроек нас интересуют в основном две: настройка доступа к интернет и настройка списков. Настройка доступа производится через закладку View/Edit System-Wide Lists, она содержит черный список IP адресов и список исключений. Первый содержит перечень адресов которым запрещен веб-доступ, для второго списка фильтрация не производится. Есть смысл включить в него машины преподавателей или иных сотрудников, которым требуется неограниченный доступ.

Закладка View/Edit A Filter Group’s Lists содержит разрешающие и запрещающие списки фраз, заголовков страниц, URL, расширений файлов и т.п. За что отвечает тот или иной список вполне понятно из названия, каждый список содержит описание и примеры записей, так что разобраться и добавить свои правила не представляет особого труда.

Источник