00001
00002
00003
00004
00005
00006
00007
00008
00009
00010
00011
00012
00013
00014
00015
00016
00017
00018
00019
00020
00036 #ifndef _vtkTextExtractionStrategy_h
00037 #define _vtkTextExtractionStrategy_h
00038
00039 #include <vtkObject.h>
00040
00041 class vtkIdTypeArray;
00042 class vtkStdString;
00043 class vtkStringArray;
00044 class vtkUnicodeString;
00045 class vtkUnicodeStringArray;
00046
00047 class VTK_TEXT_ANALYSIS_EXPORT vtkTextExtractionStrategy :
00048 public vtkObject
00049 {
00050 public:
00051 vtkTypeMacro(vtkTextExtractionStrategy, vtkObject);
00052 void PrintSelf(ostream& os, vtkIndent indent);
00053
00055
00065 virtual bool Extract(
00066 const vtkIdType document,
00067 const vtkStdString& uri,
00068 const vtkStdString& mime_type,
00069 const vtkTypeUInt8* content_begin,
00070 const vtkTypeUInt8* content_end,
00071 vtkUnicodeString& text,
00072 vtkIdTypeArray* tag_document,
00073 vtkIdTypeArray* tag_begin,
00074 vtkIdTypeArray* tag_end,
00075 vtkStringArray* tag_type) = 0;
00077
00078 protected:
00079 vtkTextExtractionStrategy();
00080 virtual ~vtkTextExtractionStrategy();
00081
00082 private:
00083 vtkTextExtractionStrategy(const vtkTextExtractionStrategy&);
00084 void operator=(const vtkTextExtractionStrategy&);
00085 };
00086
00087 #endif // !_vtkTextExtractionStrategy_h
00088