First commit
[anna.git] / source / html / DocumentFile.cpp
1 // ANNA - Anna is Not 'N' Anymore
2 //
3 // (c) Copyright 2005-2014 Eduardo Ramos Testillano & Francisco Ruiz Rayo
4 //
5 // https://bitbucket.org/testillano/anna
6 //
7 // Redistribution and use in source and binary forms, with or without
8 // modification, are permitted provided that the following conditions
9 // are met:
10 //
11 //     * Redistributions of source code must retain the above copyright
12 // notice, this list of conditions and the following disclaimer.
13 //     * Redistributions in binary form must reproduce the above
14 // copyright notice, this list of conditions and the following disclaimer
15 // in the documentation and/or other materials provided with the
16 // distribution.
17 //     * Neither the name of Google Inc. nor the names of its
18 // contributors may be used to endorse or promote products derived from
19 // this software without specific prior written permission.
20 //
21 // THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS
22 // "AS IS" AND ANY EXPRESS OR IMPLIED WARRANTIES, INCLUDING, BUT NOT
23 // LIMITED TO, THE IMPLIED WARRANTIES OF MERCHANTABILITY AND FITNESS FOR
24 // A PARTICULAR PURPOSE ARE DISCLAIMED. IN NO EVENT SHALL THE COPYRIGHT
25 // OWNER OR CONTRIBUTORS BE LIABLE FOR ANY DIRECT, INDIRECT, INCIDENTAL,
26 // SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING, BUT NOT
27 // LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES; LOSS OF USE,
28 // DATA, OR PROFITS; OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND ON ANY
29 // THEORY OF LIABILITY, WHETHER IN CONTRACT, STRICT LIABILITY, OR TORT
30 // (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE
31 // OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.
32 //
33 // Authors: eduardo.ramos.testillano@gmail.com
34 //          cisco.tierra@gmail.com
35
36
37 #include <anna/core/tracing/Logger.hpp>
38 #include <anna/core/tracing/TraceMethod.hpp>
39 #include <anna/config/defines.hpp>
40 #include <anna/core/functions.hpp>
41
42 #include <anna/io/functions.hpp>
43
44 #include <libxml/HTMLparser.h>
45
46 #include <anna/html/DocumentFile.hpp>
47
48 using namespace std;
49 using namespace anna;
50
51 _xmlDoc* html::DocumentFile::do_initialize(const char* filename)
52 throw(RuntimeException) {
53   LOGMETHOD(TraceMethod tf("anna::html::DocumentFile", "do_initialize", ANNA_FILE_LOCATION));
54   _xmlDoc* result = NULL;
55   a_filename = filename;
56   LOGDEBUG(
57     string msg("html::DocumentFile::do_initialize | Filename: ");
58     msg += filename;
59     Logger::debug(msg, ANNA_FILE_LOCATION);
60   );
61
62   if(io::functions::exists(filename) == false) {
63     string msg("html::DocumentFile::do_initialize | File: ");
64     msg += filename;
65     msg += " | Not found";
66     throw RuntimeException(msg, ANNA_FILE_LOCATION);
67   }
68
69   result = htmlParseFile(filename, NULL);
70
71   if(result == NULL)
72     throw RuntimeException(functions::asString("Error analyzing HTML document: %s", filename), ANNA_FILE_LOCATION);
73
74   return result;
75 }
76
77 _xmlDoc* html::DocumentFile::do_initialize(const anna::DataBlock&)
78 throw(RuntimeException) {
79   throw("html::DocumentFile::do_initialize | Not implemented", ANNA_FILE_LOCATION);
80   return NULL;
81 }