Плагин ScrapBook для браузера Firefox, скачиваем содержимое сайтов
Общее описание и установка
ScrapBook — это мощное бесплатное расширение для популярного браузера Firefox, которое позволяет сохранять веб-страницы на компьютер для их последующего просмотра оффлайн (без подключения к Интернету) и управлять их коллекцией. ScrapBook интенсивно развивается в течение продолжительного времени, начиная с июля 2004 года. Новые релизы появляются в среднем чаще, чем раз в месяц. ScrapBook будет полезен тем, кто серьёзно занимается поиском, сбором и обработкой информации в Интернете, а также тем, кто не имеет возможности пользоваться Интернетом непрерывно.
На момент написания этой статьи актуальная версия плагина — 1.3.3.7 от 28.06.2008 г. Сайт плагина находится здесь: http://amb.vis.ne.jp/mozilla/scrapbook/index.php?lang=en.
С помощью плагина сохраненные страницы можно рассортировать по папкам, отредактировать, добавить к ним комментарии и разметить разноцветными маркерами. Благодаря многочисленным возможностям ScrapBook иногда называют «веб-альбомом».
Вот основные возможности ScrapBook (это далеко не полный список):
Установка ScrapBook происходит практически мгновенно и полностью автоматически. Чтобы установить плагин, зайдите на сайт дополнений Firefox, на страничку ScrapBook https://addons.mozilla.org/ru/firefox/addon/427:
Нажмите на ссылку «Добавить в Firefox», в результате чего появится окно «Установка программного обеспечения», в котором необходимо нажать на «Установить»:
Дальше установка пойдёт автоматически, а в конце будет выдано окно с предложением перезапустить Firefox, что и следует проделать.
В целом ScrapBook весьма замечательный инструмент, несмотря на некоторые недостатки, о которых будет сказано ниже. По мнению автора настоящей статьи, ScrapBook вполне заслуживает оценки «пять с минусом» по пятибальной шкале, в чём вы можете убедиться, прочитав статью и попробовав поработать со ScrapBook’ом.
Теперь пройдёмся по основным возможностям ScrapBook.
Сохранение веб-содержимого
Вы можете сохранить выделенный фрагмент веб-страницы с помощью команды контекстного меню «Захватить выделенное». То же самое можно проделать, просто перетащив выделенный фрагмент веб-страницы на боковую панель ScrapBook. Фрагмент сохраняется в виде отдельной веб-страницы.
Вы можете сохранить веб-страницу по ссылке с помощью команды контекстного меню «Захватить ссылку». То же самое можно проделать, просто перетащив ссылку на боковую панель ScrapBook. Эта возможность предназначена именно для веб-страниц по ссылкам. Пользуйтесь этим для ссылок на бинарные файлы (exe, zip и подобное) с осторожностью, так как вы можете получить «неясные» результаты — на боковой панели ScrapBook могут появиться элементы с пустыми заголовками (которые можно из-за этого вообще не заметить), и воспользоваться этими элементами будет затруднительно.
Вы можете сохранить рисунок веб-страницы, просто перетащив его на панель ScrapBook. Если рисунок является ссылкой, то ScrapBook будет работать с ним точно так же, как с текстовой ссылкой (сохранять страницу по ссылке). Если же рисунок ссылкой не является, при перетаскивании в панель ScrapBook он будет сохранён в виде отдельной веб-страницы, на которой нет ничего, кроме этого рисунка.
Вы можете сохранить фрейм с помощью команды контекстного меню «Захватить фрейм». Фрейм сохраняется в виде отдельной веб-страницы.
Вы можете сохранить открытый в браузере документ PDF, перетащив иконку из панели адреса на боковую панель ScrapBook. Документ PDF сохраняется в виде отдельной веб-страницы, содержимое которой ссылается с помощью мета-тега на собственно документ PDF. (Последнее заявление может оказаться интересным для тех, кто любит покопаться в html-коде; остальные же могут просто не волноваться — документ PDF физически будет сохранён на локальном жёстком диске вашего компьютера и доступен точно так же, как любая веб-станица, сохранённая в ScrapBook.) Точно таким же образом вы можете сохранить открытый в браузере ролик FLASH или документ XML.
В момент сохранения различных видов веб-содержимого, описанных выше, вы можете вызвать диалог настроек, воспользовавшись командами «Захватить веб-страницу как…», «Захватить выделенное как..» и так далее:
В этом диалоге вы можете указать непосредственно перед сохранением, какие части содержимого веб-страницы нужно сохранять. Установленные здесь флажки сохраняются на будущее автоматически. Самый важный параметр — «Уровень глубины захвата ссылок». Используя этот параметр, вы можете выкачивать целые сайты, с произвольной глубиной вложенности страниц.
Есть некоторые тонкости. В Интернете существуют ссылки на файлы для скачивания (скажем, на zip-файлы), которые являются не «прямыми» ссылками, а ссылками на динамические веб-страницы, которые в свою очередь отдают указанные файлы. Например, ссылка на файл «test.zip» может использовать URL наподобие «attachment.php?item=1». При скачивании файла «вручную» (просто щелчком мыши), вы можете этого и не заметить — практически мгновенно появится самый обычный диалог сохранения файла. Однако, чтобы такой файл был автоматически скачан ScrapBook’ом при захвате этой страницы (например, при «глубоком» выкачивании сайта), необходимо будет поставить в вышеприведённом диалоге настроек флажок «Другие файлы» и указать расширение «php». При этом указанный «test.zip» будет сохранён на диск, к сожалению, как «attachment.php». Если же расширение «php» в нашем случае в настройках не указывать, файл «test.zip» вообще скачан не будет.
Если «Уровень глубины захвата ссылок» указан больше нуля, то после нажатия «Сохранить страницу» будет выдан диалог «Сохранения»:
Плагин выжидает несколько секунд перед тем, как начать скачивание, и вы можете приостановить процесс нажатием кнопки «Пауза», которая превратится после этого в кнопку «Старт», как вы и видите на рисунке выше. В данном диалоге отображён список ссылок, которые подлежат закачке. Вы можете снять или установить флажок напротив каждой ссылки, запретив или разрешив тем самым её скачивание. Нажатие кнопки «Фильтр» приведёт к появлению выпадающего меню, в котором вы можете:
Нажатие кнопки «Прервать» приведёт к отказу от скачивания всех ссылок.
Изначально в данном диалоге показываются ссылки только первого уровня. В процессе скачивания, если была задана глубина больше единицы, ссылок может стать больше. Вы можете в любой момент нажать кнопку «Пауза», чтобы заняться фильтрацией, или кнопку «Прервать», чтобы остановиться на том, что уже скачано. Плагин выжидает несколько секунд перед скачиванием каждой ссылки.
Для версий ScrapBook до 1.3.3.7: если вы сохраняете веб-страницу с «Уровнем глубины захвата ссылок» больше нуля, то ScrapBook автоматически создаёт «карту сайта». Такая карта сайта создаётся для каждой сохранённой веб-страницы отдельно. Чтобы просмотреть карту сайта, откройте скачанную веб-страницу, а затем воспользуйтесь иконкой ScrapBook в строке состояния браузера в правом нижнем углу. При нажатии на эту иконку появится выпадающее меню, в котором можно выбрать команду «Показать карту сохранённого веб-сайта». В версии 1.3.3.7 такую карту сайта убрали, мотивируя это ограничениями параметров безопасности Firefox третьей версии. Возможно, в будущих версиях, она появится снова. По мнению автора настоящей статьи, не существует действительно веских причин убирать этот функционал из плагина.
Организация скачанного содержимого
Вы можете организовать сохранённые веб-страницы в панели ScrapBook различными способами: у вас есть дерево, подобное дереву закладок; вы можете сортировать элементы, перетаскивая их, создавать разделители, создавать папки, помещать в них элементы и так далее.
Нажав на кнопку «Список» на панели ScrapBook, вы можете получить следующий вид:
Появляется панель списка, расположенная ниже основного дерева, в которой отображается содержимое текущей папки дерева.
Если флажок «Multi-ScrapBook» был установлен в настройках, на панели ScrapBook вы получите специальную кнопку «Multi-ScrapBook», по нажатию на которую будет выдаваться выпадающее меню. Пункт «Организовать. » этого меню вызывает диалог, в котором можно задать сколько угодно каталогов хранилищ ScrapBook. По мере добавления каталогов хранилищ выпадающее меню по кнопке «Multi-ScrapBook» будет пополняться новыми пунктами, между которыми впоследствии можно быстро переключаться.
Вы можете создавать текстовые заметки, используя команду «Создать заметку» контекстного меню панели ScrapBook. Такие заметки будут сохранены как отдельные веб-страницы и присутствовать в дереве панели ScrapBook как самостоятельные элементы.
Используя команду «Свойства» контекстного меню панели ScrapBook, для любой сохранённой веб-страницы в любой момент вы можете просматривать дату её сохранения, занимаемый размер и количество файлов, просматривать и редактировать её название, исходный URL, комментарий, изменять её значок в дереве панели. При установке флажка «Выделить страницу в веб-альбоме» элемент дерева отображается жирным шрифтом.
Редактирование сохранённых страниц
Откройте скачанную веб-страницу из панели ScrapBook, а затем воспользуйтесь иконкой ScrapBook в строке состояния браузера в правом нижнем углу. При нажатии на эту иконку появится выпадающее меню, в котором можно выбрать команду «Панель редактирования ScrapBook». На панели редактирования можно:
Специальной кнопкой на панели редактирования можно сохранить сделанные изменения. Также есть кнопка для команды «Undo» (откат последнего действия). И наконец, кнопка «
Чтобы файл sitemap.xml открылся в Firefox, можно заменить эту строку на следующую:
При этом необходимо скопировать таблицу стилей sitemap.xsl в тот же каталог, где находится сам файл sitemap.xml.
Команда «Захватить ссылку» работает не всегда адекватно. В принципе, эта команда предназначена для ссылок на веб-страницы, и в этой ситуации она работает правильно. Однако, если вы «захватываете» ссылку на бинарный файл (например, exe или zip), то могут случиться мелкие неприятности.
Закачка zip-файла при этом произойдёт, но при обращении к закачанной «странице» из панели ScrapBook будет выдан диалог с предложением выбрать программу для открытия файла или сохранить файл на диск. Если же вы захватили таким образом exe-файл, может получиться совсем неудобно: заголовок закачанной «страницы» в панели ScrapBook может оказаться пустым, а сам файл будет физически сохранён на диск под именем «untitled» без расширения (вы можете убедиться в этом, просмотрев каталог ScrapBook на вашем диске). При обращении к такой закачанной «странице» из панели ScrapBook будет также выдан диалог с предложением выбрать программу для открытия файла или пересохранить файл на диск.
В общем, такое поведение команды «Захватить ссылку» вполне объяснимо, и возможно, ошибка разработчиков ScrapBook здесь состоит в основном в том, что при таком неловком «захвате» было бы хорошо выдавать соответствующее предупреждение и не коверкать имя захваченного файла.
Если вы захватили zip-файл не по прямой ссылке, а например, по ссылке на php-скрипт с параметром (таким способом часто выкладываются так называемые «вложения» в постах на форумах), сохранённый файл будет иметь расширение «php» вместо «zip», а при обращении к этой закачке из панели ScrapBook будет выдаваться всё тот же диалог выбора программы для открытия файла или сохранения. Эту ситуацию мы уже описали раньше, когда в разделе «Сохранение веб-содержимого» говорили о динамических веб-страницах, которые отдают указанные файлы для скачивания. Коверканье расширений файлов при их сохранении, конечно, ошибка не особо приятная, особенно при автоматическом выкачивании сайтов.
Дополнения к ScrapBook
Для ScrapBook существует ряд дополнений, которые вы можете установить отдельно. Официальная страничка дополнений находится по адресу: http://amb.vis.ne.jp/mozilla/scrapbook/addons.php?lang=en.
Поскольку обо всём на свете в одной статье не расскажешь, остановимся лишь на одном дополнении для примера — ScrapIndexer. Домашняя страница этого дополнения, откуда его можно бесплатно скачать, находится здесь: http://mybyways.net/Documents/scrapindexer.htm. Это дополнение позволяет сохранить содержимое коллекции ScrapBook в виде одного CHM-файла. Формат CHM — это стандартный файл справки Windows, который откроется двойным щелчком практически на любой системе, без установки дополнительного программного обеспечения. Иметь дело с одним файлом часто гораздо удобнее, чем с горой файлов во вложенных папках. Кроме того, CHM — это сжатый файл (архив) и занимает ощутимо меньше места.
ScrapIndexer имеет вполне обычный дистрибутив и устанавливается без каких-либо нюансов как отдельное приложение. ScrapIndexer работает в режиме мастера. После запуска вы увидите его первое окно:
Флажок «Temporarily disable Script Debugger» временно отключает отладчик сценариев, если он разрешён в Internet Explorer. Во время генерации эскизов могут появиться сообщения об ошибках, которые лучше подавить.
В качестве дополнительной возможности, для создания титульного xml-файла и его xsl-таблицы стилей вы можете установить флажки «Generate index.xml» и «Copy template to index.xsl». В результате в браузерах Internet Explorer и Firefox можно будет отобразить титульный xml-файл в том же самом формате, что и титульный html-файл.
Флажок «Generate HTML Help Workshop project files» позволяет создать файлы CHM-проекта для их последующей компиляции в CHM-файл (это сработает, только если Microsoft HTML Help Workshop установлен на вашем компьютере).
Выбор шаблонов в поле «Template»:
На следующем шаге вы увидите окно результата:
Из этого окна, пользуясь полученными ссылками, вы можете открыть для просмотра сгенерированные титульные файлы, каталог данных ScrapBook (все файлы генерируются в нём), файл проекта HTML Help Workshop для его редактирования и последующей компиляции, или сразу запустить компиляцию CHM-файла.
Теперь о замеченных неприятностях. К сожалению, ScrapIndexer некорректно работает с русским языком: в файле оглавления CHM-проекта вы можете получить «вопросики». Соответственно, лучше всего проверять файлы CHM-проекта и править их вручную в HTML Help Workshop, непосредственно после создания этих файлов.
Людоговский Александр, 03.07.2008г.
Статья была написана для журнала «Компьютер Price»: часть 1 и часть 2.
Источник
Как установить scrapbook для firefox
Автор: Viper
При нажатии на ссылку установка не начинается.
Кликните правой кнопкой по ссылке и выбирите «Сохранить ссылку как. «. Затем перетащите файл «ScrapBook.xpi» на окно Firefox’a.
Я не могу установить ScrapBook на Mozilla Suite.
ScrapBook версии 0.14.0 и выше не устанавливается на Mozilla Suite. Но вы можете установить версию 0.13.7 или ниже.
Когда я пытаюсь распечатать сохранённую с помощью ScrapBook страницу, показывается сообщение об ошибке.
Вы не можете печатать в режиме редактирования. Пожалуйста, выйдите из режима редактирования перед печатью.
Я не могу сохранить с помощью ScrapBook PDF или FLASH, которы открыты во вкладке браузера.
Идите в главное меню, [Файл (Ф)] > [Сохранить (как. )] или перетащите иконку с панели навигации на боковую панель ScrapBook’a.
Как удалить местное выделение маркером?
Используйте [Очистка страницы:удаление блоков]. Удаление производиться кликом по выделению.
Как объединить две книги ScrapBook’a?
Я хочу перенести книгу ScrapBook’a с одного ПК на работе на другой ПК дома.
Используйте инструмент «Импорт / Экспорт’. Для примера: Сначала экспортируйте нужные страницы на USB-flash одного ПК, затем импортируйте их с USB-flash’a на другой ПК.
Я не хочу хранить собранную информацию в папке профиля.
Я хочу изменить путь к хранимой информации.
Сначала, переместите папку «ScrapBook» в желаемое место. Потом идите [Инструменты] > [Настройки] > [Дополнительно] и укажите [Папка для хранения данных].
Расширения для ScrapBook
Copy Page Info
Это расширение для ScrapBook аналогичное расширению «Copy URL+» для Firefox.Когда вы его установите, в контекстном меню в дереве папок ScrapBook’a появится новый пункт «Copy Page Info». Это даёт нам возможность копировать произвольную информацию о сохранённой странице в буфер обмена. Также добавляет новую вкладку «Add-on» в диалог настроек Scrapbook’a. Мы можем изменять формат копируемой информации по своему желанию.
Настройки в userChrome.css
Вы можете настраивать ScrapBook добавлением CSS кода в userChrome.css в Вашем профиле.
Как я могу использовать больший шрифт для редактирования заметок в боковой панели?
textbox#ScrapNoteTextbox <
font-size: 16px;
font-family: monospace;
>
Как я могу скрыть ненужные пункты в контекстном меню браузера?
menuitem#ScrapBookContextMenu1 < display:none; >/* скрыть ‘Сохранить выделенное’ */
menuitem#ScrapBookContextMenu2 < display:none; >/* скрыть ‘Сохранить выделенное как. ‘ */
menuitem#ScrapBookContextMenu3 < display:none; >/* скрыть ‘Сохранить страницу’ */
menuitem#ScrapBookContextMenu4 < display:none; >/* скрыть ‘Сохранить страницу как. ‘ */
menuitem#ScrapBookContextMenu5 < display:none; >/* скрыть ‘Сохранить фрейм’ */
menuitem#ScrapBookContextMenu6 < display:none; >/* скрыть ‘Сохранить фрейм как. ‘ */
menuitem#ScrapBookContextMenu7 < display:none; >/* скрыть ‘Сохранить ссылку’ */
menuitem#ScrapBookContextMenu8 < display:none; >/* скрыть ‘Сохранить ссылку как. ‘ */
Клавиатурные сочетания
Основные
Alt + K Показать/Скрыть боковую панель
Alt + J Переключить в режим редактирования
Ctrl + Shift + L Сохранить страницу
Ctrl + Shift + K Сохранить страницу как.
Дерево (Боковая панель и управление)
Del Удалить
F2 Настройки
Источник