Написать программу, способную распознавать графически представленные символы в виде растрового изображения и преобразовывать в обычный текст.
платформа: Win32,
формат графического изображения: Windows Bitmap (BMP), 8 бит,
шрифт для распознавания: Arial, 16
Этап 1. Выделение контура объекта, определение его границ.
В качестве алгоритма выделения контуров будем использовать алгоритм жука.
Общее описание алгоритма.
Отслеживающие алгоритмы основаны на том, что на изображении отыскивается объект (первая встретившаяся точка объекта) и контур объекта отслеживается и векторизуется. Достоинством данных алгоритмов является их простота, к недостаткам можно отнести их последовательную реализацию и некоторую сложность при поиске и обработке внутренних контуров. Пример отслеживающего алгоритма - "алгоритма жука" - приведен на рис. 5.12. Жук начинает движение с белой области по направлению к черной, Как только он попадает на черный элемент, он поворачивает налево и переходит к следующему элементу. Если этот элемент белый, то жук поворачивается направо, иначе - налево. Процедура повторяется до тех пор, пока жук не вернется в исходную точку. Координаты точек перехода с черного на белое и с белого на черное и описывают границу объекта.
На рис. 1 показана схема работы такого алгоритма.
Рис. 1. Схема работы отслеживающего алгоритма “жука”.
Этап 2. Построение на основе контура объекта скелетной линии.
При нахождении новой точки контура, рассчитывается расстояние между предыдущей найденной точкой и новой. Если оно превышает некоторую границу (по умолчанию в 5 единиц), она запоминается. К концу построения скелетной линии программа имеет массив координат вершин ломаной, которая является скелетной линией объекта.
Этап 3. Сравнение полученной скелетной линии с списком шаблонов.
После построения скелетной линии производится сравнение ее с списком шаблонов известных символов. При нахождении совпадения, программа записывает в строку найденный символ.
Исходный текст программы.
//---------------------------------------------------------------------------
#include
#pragma hdrstop
#include
#include
#include "ChildFormUnit.h"
#include "MainFormUnit.h"
#include "AverageFilterDialogFormUnit.h"
#include "OSRFormUnit.h"
//---------------------------------------------------------------------------
#pragma package(smart_init)
#pragma resource "*.dfm"
TChildForm *ChildForm;
TTemplates Templates;
//---------------------------------------------------------------------------
__fastcall TChildForm::TChildForm(TComponent* Owner)
: TForm(Owner)
{
}
//---------------------------------------------------------------------------
bool __fastcall TChildForm::Load9323_(AnsiString FileName)
{
try
{
9323_1->Picture->LoadFromFile(FileName);
}
catch (EInvalidGraphic& Exception)
{
AnsiString Error = "Ошибка загрузки файла изображения! Ошибка системы: ";
Error += Exception.Message;
MessageBox(this->Handle, Error.c_str(), "Ошибка", MB_OK | MB_ICONERROR);
return false;
}
if (9323_1->Picture->Bitmap->PixelFormat != pf8bit)
{
MessageBox(Handle,"Такой формат файла пока не подерживается...",
"Слабоват я пока...",MB_OK | MB_ICONSTOP | MB_APPLMODAL);
return false;
}
return true;
}
//---------------------------------------------------------------------------
void __fastcall TChildForm::FormClose(TObject *Sender,
TCloseAction &Action)
{
MainForm->DeleteActiveChildForm();
}
//---------------------------------------------------------------------------
void __fastcall TChildForm::AverageFilter()
{
AverageFilterDialogForm = new TAverageFilterDialogForm(this);
if (AverageFilterDialogForm->ShowModal() == mrCancel)
{
delete AverageFilterDialogForm;
return;
}
int Value = atoi(AverageFilterDialogForm->Edit1->Text.c_str());
delete AverageFilterDialogForm;
Byte* PrevisionLine = NULL;
Byte* CurrentLine = NULL;
Byte* NextLine = NULL;
int I = 0, J = 0;
int Summ = 0;
for (I = 0; I Picture->Bitmap->Height - 1; I++)
{
CurrentLine = (Byte*)9323_1->Picture->Bitmap->ScanLine[I];
for (J = 0; J Picture->Bitmap->Width - 1; J++)
{
Summ = 0;
if (I > 0)
{
PrevisionLine = (Byte*)9323_1->Picture->Bitmap->ScanLine[I - 1];
if (J > 0)
{
Summ += PrevisionLine[J - 1];
}
Summ = Summ + PrevisionLine[J];
if (J + 1 < 9323_1->Picture->Bitmap->Width)
{
Summ += PrevisionLine[J + 1];
}
}
if (J > 0)
{
Summ += CurrentLine[J - 1];
}
Summ += CurrentLine[J];
if (J + 1 < 9323_1->Picture->Bitmap->Width)
{
Summ += CurrentLine[J + 1];
}
if (I + 1 < 9323_1->Picture->Bitmap->Height)
{
NextLine = (Byte*)9323_1->Picture->Bitmap->ScanLine[I + 1];
if (J > 0)
{
Summ += NextLine[J - 1];
}
Summ += NextLine[J];
if (J + 1 < 9323_1->Picture->Bitmap->Width)
{
Summ += NextLine[J + 1];
}
}
if ((int)(Summ / 9) Visible = false;
9323_1->Visible = true;
}
//---------------------------------------------------------------------------
// Расстояние между двумя точками
int Distance(TVertex& V1, TVertex& V2)
{
int a = abs(V1.Y - V2.Y);
int b = abs(V1.X - V2.X);
return sqrt(a*a + b*b);
}
//---------------------------------------------------------------------------
void __fastcall TChildForm::OSR()
{
// Пороговое расстояние для простроения упрощенной фигуры
const int Treshold = 5;
// Сюда сохраняется результат распознования
AnsiString Result;
// Отладочная форма с изображением для работы
OSRForm = new TOSRForm(this);
// Направления движения жука
typedef enum {North, East, South, West} TDirectional;
TDirectional Direct;
// Координаты первой встречи с текущим объектом
int X,Y;
// Временно их используем для задания нового размера рабочего изображения
X = OSRForm->Width - OSRForm->9323_1->Width;
Y = OSRForm->Height - OSRForm->9323_1->Height;
OSRForm->9323_1->Picture->Bitmap->Assign(9323_1->Picture->Bitmap);
OSRForm->Width = OSRForm->9323_1->Width + X;
OSRForm->Height = OSRForm->9323_1->Height + Y;
OSRForm->9323_1->Canvas->Rectangle(0, 0, OSRForm->9323_1->Width - 1,
OSRForm->9323_1->Height - 1);
Graphics::TBitmap* From9323_ = 9323_1->Picture->Bitmap;
Graphics::TBitmap* To9323_ = OSRForm->9323_1->Picture->Bitmap;
// Текущие координаты маркера
int cX,cY;
// Максимальные координаты, которые занимает фигура
int MaxX = 0;
int MaxY = From9323_->Height;
// От этой координаты начинается новое сканирование по Y
int BeginY = 0;
// Обрабатываемые линии
Byte *Line, *ToLine;
char Symb = 'А';
// Текущий байт
Byte B = 0;
bool SkipMode = false;
while (true)
{
// Список координат текущего объекта
TShapeVector ShapeVector;
// Временная структура координат точки
TVertex Vertex;
// Поиск любого объекта
// Идем до тех пор, пока не встретим черную область
for (X = MaxX; X < From9323_->Width; X++)
{
for (Y = BeginY; Y < MaxY; Y++)
{
Line = (Byte*)From9323_->ScanLine[Y];
if (Line[X] < 255)
goto FindedLabel;
}
if ((X + 1 == From9323_->Width) && (Y == From9323_->Height))
{
X++;
goto FindedLabel;
}
// Если прошли до самого правого края, расширяем границы поиска до низа
if (X + 1 == From9323_->Width)
{
X = 0;
MaxX = 0;
BeginY = MaxY;
MaxY = From9323_->Height;
}
}
FindedLabel:
// Если не нашли ни одного черного пиксела, то выходим из процедуры
if ((X == From9323_->Width) && (Y == From9323_->Height))
break;
// Сначала задача найти максимальные границы обнаруженной фигуры,
// чтобы потом от нее начинать строить скелет
// Также ищем самую верхнюю точку фигуры, для начала построения
int MinX = 9323_1->Picture->Width; // Самая левая координата
MaxX = 0;
MaxY = 0;
// Самая верхняя точка
TVertex TopPoint;
TopPoint.Y = 9323_1->Picture->Height;
// Поворачиваем налево (новое направление - север)
cX = X;
cY = Y - 1;
Direct = North;
Line = (Byte*)From9323_->ScanLine[cY];
// Пока не придем в исходную точку, выделяем контур объекта
while ((cX != X) || (cY != Y))
{
// В зависимости от текущего направления движения жука
switch (Direct)
{
// Север
case North:
{
B = Line[cX];
// Если элемент "черный", поворачиваем снова "налево"
if (B < 255)
{
Direct = West;
cX--;
// Может это самая левая координата?
if (MinX > cX)
MinX = cX;
}
// Иначе поворачиваем "направо"
else
{
Direct = East;
cX++;
if (MaxX < cX)
MaxX = cX;
}
}
break;
// Восток
case East:
{
B = Line[cX];
// Если элемент "черный", поворачиваем снова "налево"
if (B < 255)
{
Direct = North;
cY--;
Line = (Byte*)From9323_->ScanLine[cY];
// Может это самая верхняя точка?
if (TopPoint.Y > cY)
{
TopPoint.Y = cY;
TopPoint.X = cX;
}
}
// Иначе поворачиваем "направо"
else
{
Direct = South;
cY++;
Line = (Byte*)From9323_->ScanLine[cY];
if (MaxY < cY)
MaxY = cY;
}
}
break;
// Юг
case South:
{
B = Line[cX];
// Если элемент "черный", поворачиваем снова "налево"
if (B < 255)
{
Direct = East;
cX++;
if (MaxX < cX)
MaxX = cX;
}
// Иначе поворачиваем "направо"
else
{
Direct = West;
cX--;
// Может это самая левая координата?
if (MinX > cX)
MinX = cX;
}
}
break;
// Запад
case West:
{
B = Line[cX];
// Если элемент "черный", поворачиваем снова "налево"
if (B < 255)
{
Direct = South;
cY++;
Line = (Byte*)From9323_->ScanLine[cY];
if (MaxY < cY)
MaxY = cY;
}
// Иначе поворачиваем "направо"
else
{
Direct = North;
cY--;
Line = (Byte*)From9323_->ScanLine[cY];
// Может это самая верхняя точка?
if (TopPoint.Y > cY)
{
TopPoint.Y = cY;
TopPoint.X = cX;
}
}
}
}
}
TopPoint.X++;
if ((!TopPoint.X) && (!TopPoint.Y))
{
TopPoint.X = X;
TopPoint.Y = Y;
}
else
{
X = TopPoint.X;
Y = TopPoint.Y;
}
// Постройка скелета
ToLine = (Byte*)To9323_->ScanLine[Y];
ToLine[X] = 0;
// Поворачиваем налево (новое направление - юг)
cX = X;
cY = Y;
Vertex.X = X;
Vertex.Y = Y;
ShapeVector.push_back(Vertex);
Direct = East;
Line = (Byte*)From9323_->ScanLine[cY];
// Пока не придем в исходную точку, выделяем контур объекта
do
{
// В зависимости от текущего направления движения жука
switch (Direct)
{
// Север
case North:
{
B = Line[cX];
// Если элемент "черный", поворачиваем снова "налево"
if (B < 255)
{
ToLine = (Byte*)To9323_->ScanLine[cY];
ToLine[cX] = 0;
Vertex.X = cX;
Vertex.Y = cY;
if (Distance(Vertex, ShapeVector[ShapeVector.size() - 1]) >= Treshold)
ShapeVector.push_back(Vertex);
Direct = West;
cX--;
}
// Иначе поворачиваем "направо"
else
{
Direct = East;
cX++;
}
}
break;
// Восток
case East:
{
B = Line[cX];
// Если элемент "черный", поворачиваем снова "налево"
if (B < 255)
{
ToLine = (Byte*)To9323_->ScanLine[cY];
ToLine[cX] = 0;
Vertex.X = cX;
Vertex.Y = cY;
if (Distance(Vertex, ShapeVector[ShapeVector.size() - 1]) >= Treshold)
ShapeVector.push_back(Vertex);
Direct = North;
cY--;
Line = (Byte*)From9323_->ScanLine[cY];
}
// Иначе поворачиваем "направо"
else
{
Direct = South;
cY++;
Line = (Byte*)From9323_->ScanLine[cY];
}
}
break;
// Юг
case South:
{
B = Line[cX];
// Если элемент "черный", поворачиваем снова "налево"
if (B < 255)
{
ToLine = (Byte*)To9323_->ScanLine[cY];
ToLine[cX] = 0;
Vertex.X = cX;
Vertex.Y = cY;
if (Distance(Vertex, ShapeVector[ShapeVector.size() - 1]) >= Treshold)
ShapeVector.push_back(Vertex);
Direct = East;
cX++;
}
// Иначе поворачиваем "направо"
else
{
Direct = West;
cX--;
}
}
break;
// Запад
case West:
{
B = Line[cX];
// Если элемент "черный", поворачиваем снова "налево"
if (B < 255)
{
ToLine = (Byte*)To9323_->ScanLine[cY];
ToLine[cX] = 0;
Vertex.X = cX;
Vertex.Y = cY;
if (Distance(Vertex, ShapeVector[ShapeVector.size() - 1]) >= Treshold)
ShapeVector.push_back(Vertex);
Direct = South;
cY++;
Line = (Byte*)From9323_->ScanLine[cY];
}
// Иначе поворачиваем "направо"
else
{
Direct = North;
cY--;
Line = (Byte*)From9323_->ScanLine[cY];
}
}
}
} while ((cX != X) || (cY != Y));
Vertex.X = X;
Vertex.Y = Y;
ShapeVector.push_back(Vertex);
To9323_->Canvas->Pen->Color = clRed;
To9323_->Canvas->MoveTo(ShapeVector[0].X, ShapeVector[0].Y);
for (UINT i = 1; i < ShapeVector.size(); i++)
{
To9323_->Canvas->LineTo(ShapeVector[i].X, ShapeVector[i].Y);
}
for (UINT i = 0; i < ShapeVector.size(); i++)
{
ShapeVector[i].X -= MinX;
ShapeVector[i].Y -= Y;
}
/*
if (Symb == 'Й')
{
Symb++;
}
if (Symb == 'а')
{
// Symb = 'A';
break;
}
if ((Symb != 'Ы') && (!SkipMode))
{
AnsiString FileName = ExtractFilePath(Application->ExeName) + "TPL";
FileName += Symb;
ofstream OutFile(FileName.c_str());
for (UINT i = 0; i < ShapeVector.size(); i++)
{
OutFile