PDA

View Full Version : Перевести дамп MySQL.



profAleks
04-07-2012, 01:03 AM
Вообщем, есть дамп базы данных MySQL от сайта, в *.txt формате, мега на 3-и.
Надо весь текст в нем перевести с русского на английский.
Пробовал кормить дампом Prompt, не берет, долго думает, а потом выпадает с ошибкой.
Причина как я понял как заголовки таблиц MySQL, так и теги HTML, ну вроде: <b>мама мыла<a href="location.com">раму</a></b>
Вопрос, чем бы все это хозяйство перевести с минимальными телодвижениями ?

crazy-mike
04-07-2012, 01:54 AM
Это задачка для ЭГЕ у московских школьников - да?

:wink1:

Все "<" и ">" в дампе ведь можно заменить на ;; или ешё что-то. Вплоть до "открыть!" и "закрыть". Но там ведь ещё и mysql escape последовательности есть!
Лучше свой вывод дампа БД вместо стандартного написать ( и свою процедуру загрузки).
Можно попробовать какой-нибудь "переводилке веб-странички" такую радость скормить.
Специально снгенерировать веб-страничку.

profAleks
04-07-2012, 02:28 AM
Это задачка для ЭГЕ у московских школьников - да?

:wink1:

Все "<" и ">" в дампе ведь можно заменить на ;; или ешё что-то. Вплоть до "открыть!" и "закрыть". Но там ведь ещё и mysql escape последовательности есть!

Понимаешь, ничего менять не надо, надо чтобы вместо:
<b>мама мыла <a href="location.com">раму</a></b>
стало:
<b>mom washed <a href="location.com">the frame</a></b>


Лучше свой вывод дампа БД вместо стандартного написать ( и свою процедуру загрузки).

Это как ? С блек-джеком и шлюхами ?


Можно попробовать какой-нибудь "переводилке веб-странички" такую радость скормить.
Специально снгенерировать веб-страничку.
Можно. За исключением того, что там порядка 1000 страничек. Замотаешься кормить.
Нужен автомат, модуль к Промпту какой-нибудь. Сунул текстовой файл, тот тосеял области с тегами, перевел, области вернул назад.

crazy-mike
04-07-2012, 02:38 AM
Понимаешь, ничего менять не надо, надо чтобы вместо:
<b>мама мыла <a href="location.com">раму</a></b>
стало:
<b>mom washed <a href="location.com">the frame</a></b>

Это как ? С блек-джеком и шлюхами ?

Можно. За исключением того, что там порядка 1000 страничек. Замотаешься кормить.
Нужен автомат, модуль к Промпту какой-нибудь. Сунул текстовой файл, тот тосеял области с тегами, перевел, области вернул назад.
Тогда просто теги заменить на что-то другое - пропустить всё через промпт , а потом восстановить теги.

profAleks
04-07-2012, 02:44 AM
Тогда просто теги заменить на что-то другое - пропустить всё через промпт , а потом восстановить теги.
Черкани чо-нибудь на Perl для примера. :wink1:

crazy-mike
04-07-2012, 02:49 AM
Черкани чо-нибудь на Perl для примера. :wink1:

а зачем? просто делаешь search and replace в каком-нибудь редакторе. Ну а потом обратно - уже просле prompt,
Коенчно же через regexp можно делать.

profAleks
04-07-2012, 03:15 AM
а зачем? просто делаешь search and replace в каком-нибудь редакторе. Ну а потом обратно - уже просле prompt,

Ага, мне на каждый тег свой серч челать ?
Слишком долго.

crazy-mike
04-07-2012, 04:35 AM
Ага, мне на каждый тег свой серч челать ?
Слишком долго.
Так ведь не на каждый тег же!!!!!! :wink1:
( там ведь не все используются )
Кром того это можно вообще совсем иначе обрабатывать. На месте тега ставить !- , а порядковый номер замены запоминать в словаре. Т.е. тегов как таковых в таком тексте просто не останется. Ну а потом их вернуть. Это в самом деле можно двумя скриптами на Perl или на чём попало сделать. Проще тупо на C,

profAleks
04-07-2012, 04:47 AM
Так ведь не на каждый тег же!!!!!! :wink1:
( там ведь не все используются )
Кром того это можно вообще совсем иначе обрабатывать. На месте тега ставить !- , а порядковый номер замены запоминать в словаре. Т.е. тегов как таковых в таком тексте просто не останется. Ну а потом их вернуть. Это в самом деле можно двумя скриптами на Perl или на чём попало сделать. Проще тупо на C,
Понял, буду посвободнее поковыряю. :34:

crazy-mike
04-07-2012, 04:52 AM
Понял, буду посвободнее поковыряю. :34:
Кстати - выпустить тэги - почти тривиально. Тэг - это всё что между угловых скобок.
Просто всё это - в словарь с запоминанием не позиции в тексте , а порядкового номера вхождения. На место вхождения какой-нибудь удобочитаемый символ подставляешь. Хоть знак $ или ещё что-то такое.
Промт такое "без тегов" должен бы нормально "сожрать". Ну , а после просто восстановить теги из "словаря".

madison_
04-07-2012, 09:26 AM
Так ведь не на каждый тег же!!!!!! :wink1:
( там ведь не все используются )
Кром того это можно вообще совсем иначе обрабатывать. На месте тега ставить !- , а порядковый номер замены запоминать в словаре. Т.е. тегов как таковых в таком тексте просто не останется. Ну а потом их вернуть. Это в самом деле можно двумя скриптами на Perl или на чём попало сделать. Проще тупо на C,
Я такую бурду по молодости на пхп писал, тырил новости с чужих сайтов и постал на своем.)))

смешно
04-12-2012, 10:37 AM
Понимаешь, ничего менять не надо, надо чтобы вместо:
<b>мама мыла <a href="location.com">раму</a></b>
стало:
<b>mom washed <a href="location.com">the frame</a></b>

Это как ? С блек-джеком и шлюхами ?

Можно. За исключением того, что там порядка 1000 страничек. Замотаешься кормить.
Нужен автомат, модуль к Промпту какой-нибудь. Сунул текстовой файл, тот тосеял области с тегами, перевел, области вернул назад.

:rofl: +1

смешно
04-12-2012, 10:41 AM
Так ведь не на каждый тег же!!!!!! :wink1:
( там ведь не все используются )
Кром того это можно вообще совсем иначе обрабатывать. На месте тега ставить !- , а порядковый номер замены запоминать в словаре. Т.е. тегов как таковых в таком тексте просто не останется. Ну а потом их вернуть. Это в самом деле можно двумя скриптами на Perl или на чём попало сделать. Проще тупо на C,


прикинь если промпт переведёт !- на какое нибудь фак...:rofl:

смешно
04-12-2012, 10:44 AM
задача на самом деле для молодых студентов. в детстве таким занимался. :)