PHP Delphi CSS HTML JavaScript Perl API ASP MySQL XML С++ VBasic WEB разработка *NIX CouchDB Hack Python
Главная Статьи Delphi Работа с файлами
Главная
 Главная  Контакты
 
Программинг
Статьи Книги ЧаВО
 
xBOOKi
Fresh Books Операционки Сети
 
Поиск
-------
 
Counters
Яндекс цитирования
Rambler's Top100
-------
 
CryptDisk.4h
Программа которая позволяет создать виртуальный шифрованный логический диск.

cryptdisk.4hack.com

-------
 
 

Работа с файлами

Решил открыть эту тему и постепенно собрать воедино основные приемы работы с файлами.

Сегодня текстовые файлы.
Текстовый файл отличается тем что он разбит на разные по длине строки, отделенные символами #13#10. Есть 2 основных метода работы с текстовыми файлами - старый паскалевский способ и через файловые потоки. У обоих есть преимущества и недостатки. Через потоки способ проще поэтому начнем с него.

Итак у всех потомков класса TStrings (TStringList, memo.Lines и т.п. ) есть методы записи и чтения в файл - SaveToFile, LoadFromFile. Преимущество - простота использования и довольно высокая скорость, недостаток - читать и писать файл можно только целиком.

Примеры.
1) Загрузка текста из файла в Memo:

Исходный код:
Сырец
Memo1.lines.loadfromfile('c:\MyFile.txt');

2) Сохранение в файл:

Исходный код:
Сырец
 Memo1.lines.savetoFile('c:\MyFile.txt');

3) А вот так можно прочитать весь файл в строку:

Исходный код:
Сырец
Function ReadFromFile(FileName:string):string;
begin
 With
TStringList.create do
   try
     
LoadFromFile(FileName);
     
result:=text;
   
finally
     
Free;
   
end;
end;


Часть II


Для более тонких операций над текстовыми файлами прийдется освоить очень древний паскалевский способ.

Итак, для доступа к текстовым файлам используется переменная типа TextFile. До сих пор не совсем понимаю что это такое физически - что-то типа "внутреннего" паскалевского Handle на файл.

Итак чтобы ассоциировать файл на диске с переменной надо проделать следующие опрерации:

1) Определяем файловую переменную:
Исходный код:
Сырец
var f:TextFile;


2) Ассоциируем ее:

Исходный код:
Сырец
AssignFile(F, 'c:\MyFile.txt');


3) Теперь надо этот файл открыть, есть 3 варианта:
  - файла нет или он должен быть перезаписан, открытие для записи:
     
Исходный код
Rewrite(f)

  - файл есть и его надо открыть для чтения (с первой строки)
     
Исходный код
Reset(f)

  - файл есть и его надо открыть для дописования строк в конец
     
Исходный код
Append(f)


Как видите не хватает очень полезных функций таких как открытия файла для чтения с произвольной строки и для записи в файл произвольной строки. Но надо учесть, что так как длины строк разные, не существует никакого способа узнать физическое место начала например 1000 строки, не прочитав всю тысячу строк. Для записи ситуация еще сложнее - вставить строку означает перезаписать всю информацию после этой строки заново. Таким образом варианты только следующие:
- Перезаписать весть файл
- Читать с первой строки
- Дописать что-то в конец
- Читать и писать файл целиком (см. выше работу через TStrings)

В конце работы открытый файл нужно закрыть:
Исходный код
CloseFile(f);


Теперь пусть у нас есть строковая переменная s для чтения строки из файла

Чтение предварительно открытого файла:
 
Исходный код
ReadLn(f, s) - будет прочитанна текущая строка и позиция чтения переведена на следующую позицию.


А как прочитать весь файл?

Исходный код:
Сырец
While not eof(f) do
 begin
   
ReadLn(f, s);
   
{здесь делаем ÷то-то с про÷итанной строкой}
 
end;


Хорошо, а если файл несколько метров есть ли способ поставить какой-нибудь ProgressBar или Gauge чтобы показывал сколько считанно? Есть, но не совсем прямой - не забыли, сколько строк в файле заранее мы не знаем, узнать можно только прочитав его весь, но показометер мы все-таки сделаем:

Исходный код:
Сырец
var  Canceled:Boolean;

Function GetFileSize(FIleName:String):integer;
 
var f: File of Byte;
begin
 try
   
AssignFile(f, FileName);
   
Reset(f);
   
result:=filesize(F);
   
CloseFile(f);
 
except
   
result:=-1;
 
end;
end;


Procedure ReadMyFile;
Var i,j:integer;
Begin
 
ProgressBar1.Max:=GetFileSize('c:\MyFile.txt');
 
ProgressBar1.position:=0;
 
assignfile(f,'c:\MyFile.txt');
 
Canceled:=False;
 
reset(f);
     
i:=0;j:=0;
     
while not eof(f) do
       begin
         
inc(j);
         
readln(f,s);
         
i:=i+length(s)+2;
         
if (j mod 1000)=0 then
           begin
             
ProgressBar1.position:=i;
             
Application.ProcessMessages;
             
if canceled then break;
           
end;
         
{здесь мы ÷то-то делаем с про÷итанной строкой}
       
end;
     
CloseFile(f);
End;


Теперь комментарии к коду.
1) Функию GetFileSize я рсссмотрю после, она немного по другому подходит к чтению файла (кстати я знаю еще по крайней мере 3 способа ее реализации, поэтому не нужно указывать что это можно сделать легче, быстрее или просто по другому - просто давайте разберем это позже)
2) Переменная i - все время указывает на количество байт которое мы считали - мы определяем длину каждой строки и прибавляем 2 (символы конца строки). Зная длину файла в байтах и сколько байт прочитано можно оценить и прогресс, но
3) Если ставить изменение прогресса после каждой строки, то это очень сильно тормознет процесс. Поэтому вводим переменную j и обновляем прогресс например 1 раз на 1000 прочитанных строк
4) Переменная Canceled - глобальная переменная. Поставьте на форму кнопку, в обработчике нажатия поставьте Canceled:=True; и нажатие кнопки прервет чтение файла.



Часть III


Приведенные выше механизмы будут работать с любым файлом, так как любой файл можно считать файлом байтов. Теперь где это можно использовать? В принципе везде, но в подавляющем большинстве случаев это будет очень неудобно, ведь скорость считывания при чтении по байтам будет на порядки более низкой чем другими способами. Однако в некоторых случаях этот способ может быть очень полезен. Например в программе вам надо заменить 100й байт файла на другой, или прочитать 100й байт файла, например во всяких читерских программах, при взломе и т.п. Здесь такой доступ будет весьма удобен. Гораздо более интересным представляется дальнейшее развитие технологии типизированных файлов (их еще лет 15 назад называли "Файлы прямого доступа"). Представим себе, что файл состоит не из байт а из более сложных структур. Например мы имеем некоторую информацию в виде:

Type MyRec=Record
          Name:string[100];
          Age:byte;
          Membership:Boolean;
          Accounts:array[1..10] of integer;
       End;

Обратите внимание, что все элементы записи точно типизированны, нет ни длинных строк, ни открытых массивов, ни объектов, другими словами, заранее точно известно сколько именно байт будет занимать переменная этого типа. Объявим переменную этого типа:

Var MyVar:MyRec;

и файл этого типа:

Var f:File of MyRec;

Теперь мы можем читать и писать сразу целую структуру, абсолютно так же как и если бы это был один байт:

AssignFile(f,'c:\MyFile.rec');
Rewrite(f);
MyVar.Name:='Vitaly';
MyVar.Age:=33;
MyVar.Membership:=True;
MyVar.Accounts[1]:=12345;
MyVar.Accounts[2]:=34985;
Write(f,MyVar);
Closefile(f);

Все остальные функции приведенные в предыдущей статье будут работать так же, только одно отличие - Seek и Size оперируют не с количеством байт, а с количеством записей.

Идем дальше. Есть такое понятие как нетипизированный файл. Это такой файл который содержит разнородные элементы. Например файл EXE - вначале он имеет заголовок, затем двоичный код, в конце какие-то ресурсы. Все части файла имеют разную длину и разную структуру. Тут уже обратится к произвольному элементу сложно, обычно надо вначале узнать где этот элемент находится, подчас это записано в предыдущем куске информации. Работа с такими файлами достаточно сложна и требует вручную разработки алгоритмов его чтения, но в связи гибкостью структуры и компактностью такие файлы составляют большинство. Для работы с нетипизированными файлами используют процедуры BlockRead и BlockWrite, которые позволяют читать/писать произвольное количество байт. Привожу пример пользования этими функциями из справки по Дельфи:


Исходный код:
Сырец
var
 
FromF, ToF: file;
 
NumRead, NumWritten: Integer;
 
Buf: array[1..2048] of Char;
begin
 if
OpenDialog1.Execute then                               { Display Open dialog box }
 
begin
   
AssignFile(FromF, OpenDialog1.FileName);
   
Reset(FromF, 1); { Record size = 1 }
   
if SaveDialog1.Execute then                              { Display Save dialog box}
   
begin
     
AssignFile(ToF, SaveDialog1.FileName); { Open output file }
     
Rewrite(ToF, 1); { Record size = 1 }
     
Canvas.TextOut(10, 10, 'Copying ' + IntToStr(FileSize(FromF))
       +
' bytes...');
     
repeat
       
BlockRead(FromF, Buf, SizeOf(Buf), NumRead);
       
BlockWrite(ToF, Buf, NumRead, NumWritten);
     
until (NumRead = 0) or (NumWritten <> NumRead);
       
CloseFile(FromF);
       
CloseFile(ToF);
   
end;
 
end;
end;


Этот код копирует из одного файла в другой. Замечания по поводу этого метода работы с файлами - плюсы - очень высокая скорость, особенно если размер буффера увеличить до 64kb-512kb, что позволит считывать файл достаточно большими кусками, чтобы обеспечить отсутствие простоев винчестера, к тому же обеспечивается очень высокая гибкость в работе. Минусы - сложность разработки, необходимость вручную писать все детали механизма чтения/записи и интерпретации данных.

Пожалуй на этом можно было бы и завершить описание работы с файлами средствами Паскаля и файловых переменных, но заглянув в Help Дельфей я обнаружил еще несколько функций достойных упоминания.

Erase(f) - удаляет файл
FilePos(f) - возвращает текущую позицию чтения/записи в файл
Flush(f) - сбрасывает кэшированные файловые операции на диск
Rename(f, 'MyNewFileName.txt') - переименование файлов
Truncate(f) - файл обрезается до текущей позиции чтения/записи
Теперь разберем возможности работы потомка TStream - TFileStream - файловый поток. Этот класс был специально введен для работы с файлами. Для работы с файловым потоком Вам надо записать в Uses модули classes, Sysutils (classes - включает в себя собственно определение класса, Sysutils - некоторые константы необходимые для работы).

Вот пример записи/перезаписи файла:

Исходный код:
Сырец
Procedure WriteFileUsingStream(s, FileName:string);
begin
 with
TFileStream.create(FileName, fmCreate or fmOpenWrite) do
   try
     
write(pointer(s)^,length(s));
   
finally
     
free;
   
end;
end;


Теперь небольшой разбор:

TFileStream.create - конструктор класса, его вызов требует указания имени файла и опций его открытия, следующие опции определены:

 fmCreate = $FFFF;
 fmOpenRead       = {content}00;
 fmOpenWrite      = {content}01;
 fmOpenReadWrite  = {content}02;
 fmShareCompat    = {content}00;
 fmShareExclusive = {content}10;
 fmShareDenyWrite = {content}20;
 fmShareDenyRead  = {content}30;
 fmShareDenyNone  = {content}40;

Теперь метод Write - этим методом в файл пишется  любая информация из буфера любого типа, Вам надо указать только буффер и количество записываемых байтов. В данном случае используется переменная типа String в качестве буффера, но так как для длинных строк она представляет собой лишь указатель, то конструкция "pointer(s)^" заставляет обращаться именно к ее содержимому.

Продолжение следует.
А вот этот код демонстрирует чтение файла с использованием файлового потока:

Исходный код:
Сырец
 var p:PChar;
begin
 
GetMem(p, 255);
 
with TFileStream.create('c:\myText.txt', fmOpenReadWrite) do
   try
     
Seek(10,soFromBeginning);
     
read(p^, 254);
   
finally
     
free;
   
end;
 
showmessage(p);
 
FreeMem(p);
end;

И пояснения к коду:
1) Никаких проверок длину файла и его наличие здесь не делается - это демонстрационный код, а не готовая процедура чтения.
2) Файл мы считываем в буффер типа PChar (с тем же успехом можно использовать массив или любой другой контейнер). Для тех кто не помнит - процедуры   GetMem(p, 255) и FreeMem(p) - распределение памяти для строки и освобождение памяти.
3) Метод потока  Seek позволяет установить текущую позицию считывания/записи файла. Первый параметер - номер байта, второй - это от чего считать этот байт (у нас считать от начала файла), возможны варианты:
 soFromBeginning - от начала файла
 soFromCurrent - от текущей позиции считывания
 soFromEnd - от конца файла (в этом случае номер байта должен быть отрицательным или равным нулю)
4) Собственно считывание из потока осуществляется методом read, в котором указывается в качестве параметров буфер в который мы читаем и желаемое количество  байт для чтения. Метод read является функцией, которая возвращает количество байт реально прочитанных из потока.

Заканчивая о файловых потоках хочу упомянуть о методе
CopyFrom который позволяет перекачивать информацию из одного потока в другой и о свойствах:

Size - размер файла
Position - текущая позиция чтения/записи потока

Работа с файловыми потоками весьма быстра, этот класс, являсь классом VCL, в то же время базируется на низкоуровневых функциях Windows, что обеспечивает очень высокую скорость работы и стабильность операций. К тому же многие компоненты и классы VCL поддерживаю прямое чтение и запись с файловыми потоками, что занчительно упрощает работу - например TStringList, TBlobField, TMemoField и другие.
Файловые потоки могут быть рекомендованы к использованию в большинстве  случаев для чтения и записи файлов (за исключением специфических ситуаций, требующих каких-то других подходов), другими словами если вам надо просто записать или считать файл, используйте файловые потоки.

Еще один способ работы с файлами - это открытие Handle на файл и работу через него. Тут есть 2 варианта - можно использовать функции Дельфи или использовать WinAPI напрямую.

При использовании функций Дельфи можно применять следующие функции:

 FileOpen(FileName, fmOpenWrite or fmShareDenyNone) - функция открывает файл и возвращает целое цисло - Handle на файл. Параметры функции - имя файла и тип доступа (все типы доступа я перечислил ранее). Если файл успешно открыт то Handle должен быть положительным цислом, отрицательное число - это код ошибки.

Во всех остальных функциях используется именно значение Handle, возвращаемое этой функцией.

 FileClose(Handle: Integer) - закрывает файл


 FileRead(Handle: Integer; var Buffer; Count: Integer): Integer;
 FileWrite(Handle: Integer; const Buffer; Count: Integer): Integer;
Эти функции для чтения/записи файла, где Buffer любая переменная достаточного размера для чтения/записи куска информации (обычно типа PChar или массив), Count-количество байт, которое Вы желаете записать/прочитать. Функции возвращают количество байт которые реально были прочитанны или записаны.

Этот тип доступа к файлам применяется весьма редко. Дело в том что он практически дублирует соответствующие функции WinAPI и к тому же обычно работает несколько медленнее, чем например потоки. И все же использование функций FileOpen и FileClose не лишено привлекательности. Наряду с тем что эти функции намного легче в использовании соответствующих функций WinAPI (можете сравнить - FileOpen имеет 2 параметра, cooтветствующая функция WinAPI - CreateFile имеет 7 параметров, большая часть из которых реально требуется лишь в ограниченном числе случаев) этот путь доступа открывает возможность прямого использования всех функций WinAPI про работе с файлами, которые требуют Handle на открытый файл.

Дельфи предоставляет довольно широкие возможности по файловым операциям без использования механизмов открытия/закрытия файлов.

Вот список наиболее употребимых функций, большинство из которых в фачкстве параметров нуждаются только в имени файла:

ChDir(NewCurrentPath: string); - изменяет текущий каталог (в среде Windows сие конечно не так актуально как в ДОС, но все же), прочитать же текущий каталог можно функцией GetCurrentDir, а текущий каталог для определенного драйва - GetDir.

CreateDir(const Dir: string): Boolean; - создает каталог. При этом предыдущий уровень должен присутствовать. Если вы хотите сразу создать всю вложенность каталогов используйте функцию ForceDirectories(Dir: string): Boolean; Обе функции возвращают True если каталог создан

DiskFree(Drive: Byte): Int64; - дает свободное место на диске. Параметер - номер диска 0 = текущий, 1 = A, 2 = B, и так далее

DiskSize(Drive: Byte): Int64; - размер винта. Обратите внимание на то что для результата этой и предыдущей функций абсолютно необходимо использовать переменную типа Int64, иначе макимум того что вы сможете прочитать правильно будет ограничен 2Gb

FileExists(const FileName: string) - применяется для проверки наличия файла

FileGetAttr(const FileName: string): Integer;
FileSetAttr(const FileName: string; Attr: Integer): Integer; - функции для работы с атрибутами файлов. Вот список возможных атрибутов:
faReadOnly {content}000001 Read-only files
faHidden {content}000002 Hidden files
faSysFile {content}000004 System files
faVolumeID {content}000008 Volume ID files
faDirectory {content}000010 Directory files
faArchive {content}000020 Archive files
faAnyFile {content}00003F Any file
(Естественно не все атрибуты применимы во всех случаях)

RemoveDir(const Dir: string): Boolean; - удаляет папку(пустую)
DeleteFile(const FileName: string): Boolean; - удаляет файл
RenameFile(const OldName, NewName: string) - переименовывает файл

Привожу пример функции которая собирает довольно большое количество информации о выбранном файле:

Исходный код:
Сырец

Type TFileInfo=record
               
Exists:boolean;//true если файл найден
               
Name:String; //имя файла с расширением
               
ShortName:String;//DOS 8.3 имя файла
               
NameNoExt:String;//имя файла без расширения
               
Extension:string;//расширение файла
               
AssociatedFile:string;//программа с которой ассоциирован файл
               
Path:string;// путь к файлу
               
ShortPath:string;// DOS 8.3 путь файла
               
Drive:string;// дисковод на котором находится файл
               
CreateDate:TDateTime; //время когда файл создан
               
Size:Int64;// размер файла (работает для файлов и больше 2Gb)
               
Attributes:record //нали÷ие/отсутствие системных атрибутов
                             
ReadOnly:boolean;
                             
Hidden:boolean;
                             
System:boolean;
                             
Archive:boolean;
                           
end;
               
ModifyDate:TDateTime; //время последнего изменения файла
               
LastAccessDate:TDateTime; //дата последнего открытия
             
end;


Function ReadFileInfo(FileName:string):TFileInfo;
var ts:TSearchRec;

 
Function FileTime2DateTime(FT:_FileTime):TDateTime;
 
var FileTime:_SystemTime;
 
begin
     
FileTimeToLocalFileTime(FT, FT);
     
FileTimeToSystemTime(FT,FileTime);
     
Result:=EncodeDate(FileTime.wYear, FileTime.wMonth, FileTime.wDay)+
             
EncodeTime(FileTime.wHour, FileTime.wMinute, FileTime.wSecond, FileTime.wMilliseconds);
 
end;

 
Function AssociatedFile(FileExt:string):string;
   
var key:string;
 
begin
    With
TRegistry.create do
      try
       
RootKey:=HKEY_CLASSES_ROOT;
       
OpenKey(FileExt, false);
       
Key:=ReadString('');
       
CloseKey;
       
OpenKey(key+'\Shell\open\command', false);
       
result:=ReadString('');
       
Closekey;
     
finally
       
free;
     
end
  end
;

begin
 
Result.Name:=ExtractFileName(FileName);
 
Result.Extension:=ExtractFileExt(FileName);
 
Result.NameNoExt:=Copy(Result.Name,1,length(Result.Name)-length(Result.Extension));
 
Result.Path:=ExtractFilePath(FileName);
 
Result.Drive:=ExtractFileDrive(FileName);
 
Result.ShortPath:=ExtractShortPathName(ExtractFilePath(FileName));
 
if lowercase(Result.Extension)<>'.exe' then Result.AssociatedFile:=AssociatedFile(Result.Extension);
 
if FindFirst(FileName, faAnyFile, ts)=0 then
   begin
 
Result.Exists:=true;
     
Result.CreateDate:=FileDateToDateTime(ts.Time);

Result.Size:=ts.FindData.nFileSizeHigh*4294967296+ts.FindData.nFileSizeLow;
     
Result.Attributes.ReadOnly:=(faReadOnly and ts.Attr)>0;
     
Result.Attributes.Hidden:=(faHidden and ts.Attr)>0;
     
Result.Attributes.System:=(faSysFile and ts.Attr)>0;
     
Result.Attributes.Archive:=(faArchive and ts.Attr)>0;
     
Result.ModifyDate:=FileTime2DateTime(ts.FindData.ftLastWriteTime);
     
Result.LastAccessDate:=FileTime2DateTime(ts.FindData.ftLastAccessTime);
     
Result.ShortName:=ts.FindData.cAlternateFileName;
     
Findclose(ts);
   
end
 else
Result

Свежее
Резервное копирование rsync-ом
DNS Amplification (DNS усиление)
Алгоритм Шинглов — поиск нечетких дубликатов текста
Metasploit Framework. Обзор
Использование CouchDB
-------



 
Copyright © 2003-2009   Frikazoid.
Rambler's Top100