Из чего состоит String?

Ответ на этот вопрос зависит от версии Java.

Во всех версиях есть два обязательных поля: массив char[] value, в котором хранятся символы строки и переменная int hash, в которой храниться хэш-сумма.

В версиях Java младше 7 были поля offset и count. Они использовались для повторного использования массивов из билдеров и строк, без необходимости их пересоздания. В более новых версиях эти поля убрали, для экономии памяти.

В ранних версиях Java, для хранения строк применялась кодировка UTF-16, в которой для каждого символа выделялось 2 байта. Однако большинство строк состоит из ASCII-символов, для которых требуется всего один байт. Они составляют кодировку LATIN-1. В этом случае старший байт не используется, и на его место записываются нули. В результате примерно половина памяти, выделяемая под строки, не используется, но четвертую часть памяти, выделяемой под программу, занимают строки.

В Java 6 появилась опция Compressed String (упакованная строка). Она позволяла хранить строки в кодировке LATIN-1 и использовала для этого массив byte. Однако, при использовании данной опции, были выявлены проблемы и эту фичу убрали.

Похожая фича появилась в Java 9 под именем Compact Strings. Для её реализации в классе String были добавлены поля coder и флаг COMPACT_STRINGS. Поле coder предназначено для переключения кодировок, а флаг COMPACT_STRINGS включает и выключает данную опцию.

Поделиться уроком

Ответить

Ваш адрес email не будет опубликован. Обязательные поля помечены *