информационная безопасность
без паники и всерьез
 подробно о проектеRambler's Top100
Портрет посетителяСетевые кракеры и правда о деле ЛевинаАтака на Internet
BugTraq.Ru
Русский BugTraq
 Анализ криптографических сетевых... 
 Модель надежности двухузлового... 
 Специальные марковские модели надежности... 
 Phrack #70/0x46 
 Возможно, Facebook наступил на... 
 50 лет электронной почте 
главная обзор RSN блог библиотека закон бред форум dnet о проекте
bugtraq.ru / форум / programming
Имя Пароль
ФОРУМ
все доски
FAQ
IRC
новые сообщения
site updates
guestbook
beginners
sysadmin
programming
operating systems
theory
web building
software
hardware
networking
law
hacking
gadgets
job
dnet
humor
miscellaneous
scrap
регистрация





Легенда:
  новое сообщение
  закрытая нитка
  новое сообщение
  в закрытой нитке
  старое сообщение
  • Напоминаю, что масса вопросов по функционированию форума снимается после прочтения его описания.
  • Новичкам также крайне полезно ознакомиться с данным документом.
Волею судеб у меня оказался w3c-шный стандарт XML 1.1 [update] 08.09.06 15:21  Число просмотров: 2043
Автор: amirul <Serge> Статус: The Elderman
Отредактировано 08.09.06 15:42  Количество правок: 1
<"чистая" ссылка>
> > Получается, что задача сводится к тому, чтобы
> представить
> > 128-бит GUID в виде 16 строковых символов XML.
>
> Совершенно верно.

Еще одно уточнение. Каким именно элементом XML-я является этот DocID (насколько я понял это атрибут в стартовом теге типа <document DocID="guidbla-bla-bla" ....>)

Стандарт описывает значение атрибута как
AttValue	   ::=   	'"' ([^<&"] | Reference)* '"' 
			|  "'" ([^<&'] | Reference)* "'"

---

Это означает всего лишь, что в значении атрибута, ограниченном кавычками запрещены только три символа: '<', '&' и '\"'
Ну а в значении атрибута, ограниченном апострофами, соответственно вместо кавычки запрещен апостроф.
Reference это &amp;, &lt; и т.д.

Кстати, понимает ли ваш клиент reference-ы? Если да, то проблемы нет вообще. Просто записать в атрибуте 16 байт, заменяя все кавычки, амперсанды и знаки меньше их reference-ами. Если нет, то все как написал leo, используя алфавит из 253-х символов.

> Интересно. Но в силу моей тугодомчивости, не совсем
> понятно.
> Есть последовательность из 16 байт. Есть алфавит из, пусть,
> 64 литер.

64 - мало. Нужно сохранить как можно больше инфы. Для этого надо выбрать как можно бОльший размер алфавита.

> Можно "сдвинуть" каждый байт набора символов (0-255) к
> номеру символа в "координатах" алфавита (0-64):

> b[0] = b[0] mod 64;
> ...
> b[15] = b[15] mod 64;

> Правильно ли я понял ("... для каждой половины 8 раз берем
> остаток от деления на
> размер алфавита и переводим в соответствующий символ
> ...")?

Нет.
Это обычное преобразование из одной системы счисления в другую. Тебе надо перевести твой GUID в 253-ричную систему счисления.

Псевдокод:

int i;
bignum GUID;
char newGUID[16];

for (i = 0; i < 16; i++) {
newGUID[i] = GUID % 253; // здесь еще надо учесть, что "дырки" находятся не в конце, а в средине алфавита
GUID /= 253;
}

---

В принципе, если нет желания возиться с большими числами, можно преобразовать по 64-битным кусочкам (64-битная арифметика встроена во все современные компиляторы).

--------------------
Я понял, что ты хотел сказать. Действительно можно обойтись только 8-битной арифметикой. Никаких остатков от деления не надо. Просто заменяй амперсанд, кавычку и знак меньше на, к примеру, 0, 1 и 2 соответственно. Все остальное - без изменений.
<programming> Поиск 








Rambler's Top100
Рейтинг@Mail.ru


  Copyright © 2001-2021 Dmitry Leonov   Page build time: 0 s   Design: Vadim Derkach