e48d0c27cc9964eac4599347c1397b53e46d4266
[anna.git] / DocumentFile.cpp
1 // ANNA - Anna is Not Nothingness Anymore
2 //
3 // (c) Copyright 2005-2014 Eduardo Ramos Testillano & Francisco Ruiz Rayo
4 //
5 // http://redmine.teslayout.com/projects/anna-suite
6 //
7 // Redistribution and use in source and binary forms, with or without
8 // modification, are permitted provided that the following conditions
9 // are met:
10 //
11 //     * Redistributions of source code must retain the above copyright
12 // notice, this list of conditions and the following disclaimer.
13 //     * Redistributions in binary form must reproduce the above
14 // copyright notice, this list of conditions and the following disclaimer
15 // in the documentation and/or other materials provided with the
16 // distribution.
17 //     *  Neither the name of the copyright holder nor the names of its
18 // contributors may be used to endorse or promote products derived from
19 // this software without specific prior written permission.
20 //
21 // THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS
22 // "AS IS" AND ANY EXPRESS OR IMPLIED WARRANTIES, INCLUDING, BUT NOT
23 // LIMITED TO, THE IMPLIED WARRANTIES OF MERCHANTABILITY AND FITNESS FOR
24 // A PARTICULAR PURPOSE ARE DISCLAIMED. IN NO EVENT SHALL THE COPYRIGHT
25 // OWNER OR CONTRIBUTORS BE LIABLE FOR ANY DIRECT, INDIRECT, INCIDENTAL,
26 // SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING, BUT NOT
27 // LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES; LOSS OF USE,
28 // DATA, OR PROFITS; OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND ON ANY
29 // THEORY OF LIABILITY, WHETHER IN CONTRACT, STRICT LIABILITY, OR TORT
30 // (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE
31 // OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.
32 //
33 // Authors: eduardo.ramos.testillano@gmail.com
34 //          cisco.tierra@gmail.com
35
36
37 #include <sys/types.h>
38 #include <sys/stat.h>
39 #include <fcntl.h>
40 #include <unistd.h>
41
42 #include <anna/core/tracing/Logger.hpp>
43 #include <anna/core/tracing/TraceMethod.hpp>
44 #include <anna/config/defines.hpp>
45 #include <anna/core/functions.hpp>
46
47 #include <anna/io/functions.hpp>
48
49 #include <libxml/HTMLparser.h>
50
51 #include <anna/xml/DocumentFile.hpp>
52
53 using namespace std;
54 using namespace anna;
55 using namespace anna::xml;
56
57 _xmlDoc* DocumentFile::do_initialize(const char* filename)
58 throw(RuntimeException) {
59   LOGMETHOD(TraceMethod tf("anna::xml::DocumentFile", "do_initialize", ANNA_FILE_LOCATION));
60   _xmlDoc* result;
61   a_filename = filename;
62   LOGDEBUG(
63     string msg("xml::DocumentFile::do_initialize | Filename: ");
64     msg += filename;
65     Logger::debug(msg, ANNA_FILE_LOCATION);
66   );
67
68   if(io::functions::exists(filename) == false) {
69     string msg("xml::DocumentFile::do_initialize | File: ");
70     msg += filename;
71     msg += " | Not found";
72     throw RuntimeException(msg, ANNA_FILE_LOCATION);
73   }
74
75   result = xmlParseFile(filename);
76
77   if(result == NULL)
78     throw RuntimeException(functions::asString("Error analyzing XML document: %s", filename), ANNA_FILE_LOCATION);
79
80   return result;
81 }
82
83 _xmlDoc* DocumentFile::do_initialize(const anna::DataBlock&)
84 throw(RuntimeException) {
85   throw("xml::DocumentFile::do_initialize | Not implemented", ANNA_FILE_LOCATION);
86   return NULL;
87 }
88
89
90 const anna::DataBlock& DocumentFile::getContent() const
91 throw(RuntimeException) {
92   const anna::DataBlock& result = Document::getContent();
93
94   if(result.isEmpty() == false)
95     return result;
96
97   int stream;
98
99   if((stream = open(a_filename.c_str(), O_RDONLY)) == -1)
100     throw RuntimeException(a_filename, errno, ANNA_FILE_LOCATION);
101
102   const int size = lseek(stream, 0, SEEK_END);
103   lseek(stream, 0, SEEK_SET);
104   char* buffer = new char [size];
105   read(stream, buffer, size);
106   close(stream);
107   const_cast <DocumentFile*>(this)->setContent(buffer, size);
108   delete buffer;
109   return result;
110 }
111
112